ОТЧЕТ по лабораторной работе
Проверка статистических гипотез
Теоретическая часть
Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки, и проверяемое по выборке (по результатам наблюдений).
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
Гипотезы разделяются на простые (однозначно характеризующие параметр распределения случайной величины и содержащие только одно предположение) и сложные (состоящие из конечного или бесконечного множества простых гипотез и содержащие более одного предположения).
При проверке гипотезы могут быть допущены ошибки двух видов: ошибка первого рода, если отклонена верная нулевая гипотеза, и ошибка второго рода, если принята неверная нулевая гипотеза.
Принятие или отклонение гипотезы Н0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью a тогда, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1. Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность - это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия.
Для проверки статистической гипотезы используется специально подобранная случайная величина К с известным законом распределения, называемая статистическим критерием. Множество ее возможных значений разбивается на два непересекающихся подмножества: одно из них (критическая область) содержит значения критерия, при которых нулевая гипотеза отклоняется, второе (область принятия гипотезы) – значения К, при которых она принимается. Значения К, отделяющие критическую область от области принятия гипотезы, называются критическими точками kр. Критическая область может быть правосторонней (если она задается неравенством ), левосторонней (К<kкр) или двусторонней (К<(kкр)1, К>(kкр)2). Для ее нахождения нужно задать вероятность ошибки первого рода α, называемую уровнем значимости; тогда, например, правосторонняя критическая область задается условием p(К>kкр)= α.
Порядок проверки статистической гипотезы таков:
1) задается уровень значимости α, выбирается статистический критерий К и вычисляется (обычно по таблицам для закона распределения К) значение kкр; определяется вид критической области;
2) по выборке вычисляется наблюдаемое значение критерия Кнабл;
3) если Кнабл попадает в критическую область, нулевая гипотеза отвергается; при попадании Кнабл в область принятия гипотезы нулевая гипотеза принимается.
Существуют различные методы проверки гипотез о неизвестных параметрах известных законов распределения. Но чаще на практике закон распределения неизвестен и необходимо выбрать модель закона и проверить возможность принять выдвинутую модель.
Если закон распределения неизвестен, то есть основания предполагать, что он имеет определенный вид (исходя из теоретических предпосылок, опыта из предшествующих исследований и т.д.), то проверяют нулевую гипотезу H0, состоящую в том, что генеральные совокупности распределяются по такому же закону. Проверка начальной гипотезы о предполагаемом законе осуществляется на основе критерия согласия.
Критерий согласия - это критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Существует несколько критериев. Ограничимся описанием применения критерия Пирсона (c2). Этот критерий можно применять для проверки любого закона распределения. В этом состоит его преимущество.
Эмпирические и теоретические частоты обычно различаются. Это различие может быть случайным (незначимым) или неслучайным ( значимым). Если различия неслучайны, то выдвинутая нулевая гипотеза неверна.
Критерий Пирсона позволяет ответить на вопрос о значимости или незначимости различий.
Схема применения критерия
- Выдвижение начальной гипотезы H0, состоящей в том, что случайная величина X распределена по нормальному закону распределения.
- Необходимо сравнить эмпирические (найденные экспериментальным путем) и теоретические (найденные исходя из закона распределения) частот. Однако как бы точно не был подобран закон распределения между теоретическими и эмпирическими частотами неизбежны расхождения возникает вопрос, объяснимы ли эти расхождения только случайными факторами, связанные с ограниченным числом наблюдений, или это связано с неправильным выбором теоретического закона распределения. Критерий Пирсона позволяет ответить на этот вопрос, однако как и любой другой критерий, он не доказывает справедливости гипотез, а лишь устанавливает ее согласие или несогласие с экспериментальными данными на принятом уровне значимости. В качестве проверки нулевой гипотезы применяется случайная величина χ2, которая вычисляется по формуле где ni - эмпирические частоты, - теоретические частоты.
- По таблице χ2 - Пирсона находят критические значения χ2, которое зависит от двух параметров α и k, где α - заданный уровень значимости (обычно 0,05 0,01 0,1) (то есть с вероятностью ≈0,9 можно гарантировать принятие или опровержение гипотезы) k - число степеней свободы. Оно находится по формуле k = m − r − 1, где m - число групп (интервалов в вариационном ряду), r - число параметров распределения (для нормального распределения r = 2, для показательного распределения r = 1, для равномерного r = 2).
Условно статистику X² можно записать так: X² = ∑ (H-T)²/T; где Н – наблюдаемые частоты vi, T – теоретические (ожидаемые) частоты np iº.
- Необходимо сравнить χ2 критическое и χ2 наблюдаемое. Если χ2 критическое больше χ2 наблюдаемого, то гипотеза принимается, если χ2 критическое меньше χ2 наблюдаемого, то гипотеза опровергается.
- Сделать вывод.
Задание:
- По выборке по гистограмме, которой можно предположить нормальный закон распределения проверить гипотезы о значении математического ожидания в случае, когда дисперсия неизвестна.
- Проверить гипотезы о значении дисперсии генеральной совокупности.
- Проверить гипотезы о равенстве дисперсий генеральной совокупности
- Проверить гипотезы о равенстве генеральных средних двух генеральных совокупностей при неизвестных генеральных дисперсий.
Данные:
|
Столбец 1 |
Столбец 2 |
Столбец 3 |
Среднее значение |
222,2 |
119,22 |
25,25 |
Стандартная ошибка |
1,60839 |
1,550 |
3,326 |
Медиана |
221,5 |
120 |
19,95 |
Мода |
221 |
103 |
#Н/Д |
Стандартное отклонение |
11,37 |
10,96 |
23,52 |
Дисперсия выборки |
129,35 |
120,22 |
553,32 |
Мат.ожидание:
- Решение для 1 столбца:
217.9 < m <226.5
- Решение для 2 столбца:
115.02 < m <123.42
Дисперсия:
1 столбец:
86.33<σ< 223.48
2 столбец:
80.23<σ< 207,71
- Проверка гипотезы о значении мат.ожидания в случае, когда дисперсия неизвестна.
Для проверки гипотезы строится статистика t.
В случае справедливой нулевой гипотезы эта статистика распределена по закону Стьюдента с n-1 степенями свободы.
Если , то строиться правосторонняя критическая область.
Если , то строиться левосторонняя критическая область.
Если , то строится двусторонняя критическая область.
Если , то
Если , то
Решение:
2.6 , т.к. m1 > m0, то строится правосторонняя критическая область и – t =
Так как t < tкр, то Н0 принимается, то есть выборочные данные не противоречат утверждению о том, что мат.ожидание
- Проверить гипотезы о значении дисперсии генеральной совокупности.
Для проверки гипотезы строится статистика
, которая распределена по закону Пирсона с n-1 степенями свободы.
Если , то строиться правосторонняя критическая область.
Если , то
Если , то строится правосторонняя критическая область.
Если , то
Если , то строится двусторонняя критическая область.
Если , то
Решение:
Так , то
= 67,5. Так как , то принимается, то есть выборочные данные не противоречат утверждению о том, что дисперсия равна 129,35.
- Проверить гипотезы о равенстве дисперсий генеральной совокупности.
Пусть ); .
случайные выборки из генеральной совокупности
По выборкам найдены выборочные оценки
Требуется проверить гипотезу
Строится статистика F = , которая распределена по закону Фишера-Снедекора с числом степеней свободы
Для проверки гипотезы строиться правосторонняя критическая область.
)
Если , то отвергается.
= 1,6
Так как , то принимается, то есть выборочные данные противоречат утверждению о том, что дисперсии генеральных совокупностей равны
- Проверка гипотезы о равенстве генеральных средних двух генеральных совокупностей при неизвестных генеральных дисперсий.
Требуется проверить гипотезу
Строится статистика , которая распределена по закон Стьюдента с степенями свободы.
Ткр = .
Tn = 0,98 < T = 1,98, => H0 принимается, то есть выборочные данные не противоречат утверждению о том, что средние двух генеральных совокупностей равны.
Вывод:
Проверка гипотезы о значении мат.ожидания в случае, когда дисперсия неизвестна: этом случае выберем в качестве критерия случайную величину, которая имеет распределение Стьюдента с k = n - 1 степенями свободы. Критическое значение и критическая область выбираются в соответствии с альтернативной гипотезой и задаваемым уровнем значимости. Так как, мат.ожидание по первой выборке при Н0 меньше m1 при конкурирующей гипотезы, то строится правосторонняя крит.область. И если Tнабл < - tправост.кр.., нулевую гипотезу отвергают.
Проверка гипотезы о значении дисперсии генеральной совокупности: экспериментальное значение критерия больше критического (не попало в область принятия нулевой гипотезы), следовательно, проверяемая гипотеза противоречит опытным данным, и при уровне значимости наблюдаемое различие в оценках дисперсии следует считать значимым, => выюорочные данные противоречат утверждению о том, что дисперсия равна 6.
Из таблиц распределения находится критическое значение критерия для уровня значимости а и числа степеней свободы n=n–3. Вывод: если то эмпирическое распределение не соответствует нормальному распределению на уровне значимости a, в противном случае нет оснований отрицать это соответствие.
Проверка гипотезы о равенстве дисперсий генеральной совокупности: если экспериментальное значение статистики меньше критического, то при уровне значимости нет оснований отвергнуть нулевую гипотезу, считается адекватной опытным данным, и в этом случае делается вывод о том, что наблюдения не противоречат проверяемой гипотезе.
Проверка гипотезы о равенстве генеральных средних двух генеральных совокупностей при неизвестных генеральных дисперсий: соответствующая статистика критерия имеет распределение Стьюдента. Нулевая гипотеза не отвергается, так как значение достигнутого уровня статистической значимости для вычисленного t-критерия оказалось больше заданного критического уровня.
Скачать: