Статистическая гипотеза – гипотеза о виде закона распределения
случайной величины, о параметрах этого распределения или о соотношении этих
параметров.
Выдвигается нулевая гипотеза H0, подлежащая
проверке. Подбирается критическое событие s с известной малой вероятностью a, по которой делают вывод принимать или отвергать гипотезу H0. H0 отвергают,
если событие S происходит, при этом существует
риск ошибки первого рода: отвергнуть правильную гипотезу. Вероятность этой
ошибки (a)
называется уровнем значимости гипотезы H0. Или H0
принимается, если событие S не происходит. Возникают два
вопроса: о единственности события S, о
вероятности другой ошибки – принять неверную гипотезу. На эти вопросы можно
дать ответ: если верно следующее предположение – когда неверна гипотеза H0 всегда
справедливо другое предположение H1 - альтернативная или конкурирующая гипотеза.
Значение критерия,
полученного по эмпирическим данным принято называть наблюдаемым
значением, а точки на числовой оси, разделяющие область принятия гипотезы и
критические области называются критическими значениями.
Задача проверки гипотезы H0 сводится к
отысканию значения Kнабл и сравнению этого значения с Ккритич.
Точки, отделяющие критическую область от области принятия
называются критическими точками.
Для проверки
нулевой гипотеза используют специально подобранную случайную величину, точное
или приближенное распределение которой известно. Ее обозначают t если она
распределена по закону Стюдента, X2
- по закону "хи квадрат", F- по
закону Фишера, G - по закону Кохрэна.
Обозначим эту величину К
Статистическим
критерием (или просто критерием) называется случайная величина К, служащая для проверки нулевой гипотезы.
Для проверки
гипотезы по данным выборок вычисляют частные значения входящих в критерий
величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым
значением (Кнабл) называют значение
критерия, вычисленное по выборкам.
После выбора
определенного критерия множество всех его возможных значений разбивают на два
непересекающихся подмножества; одно из них содержит значения критерия,
при которых нулевая гипотеза отвергается, а другое - при которых она
принимается.
Критической
областью называют совокупность значений критерия, при которых нулевую гипотезу
отвергают.
Областью
принятия гипотезы (областью допустимых значений) называют совокупность
значений критерия, при которых гипотезу принимают.
Основной принцип проверки
статистических гипотез можно сформулировать так: если наблюдаемое
значение критерия принадлежит критической области - гипотезу отвергают, если
наблюдаемое значение критерия принадлежит области принятия гипотезы -
гипотезу принимают.
Поскольку
критерий К - одномерная случайная
величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому
критическая область и область принятия гипотезы также являются интервалами, и,
следовательно, существуют точки, которые их разделяют.
Критическими
точками Ккр называют точки,
отделяющие критическую область от области принятия гипотезы.
Различают,
одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические
области.
Правосторонней
называют критическую область, определяемую неравенством К>Ккр , где Ккр- положительное число.
Левосторонней
называют критическую область, определяемую неравенством К<Ккр , где Ккр- отрицательное число.
Односторонней
называют правостороннюю или левостороннюю критическую
областью.
Двусторонней
называют критическую область, определяемую неравенствами K<K1,
K>K2, где К2>К1.
Критерий Пирсона.
Критерий универсален по отношению к любому
распределению.
Критерий является квадратичной формой вида:
pi-
эмпирические частоты,p(штрих-итое)i- теоретические частоты
Полученное значение сравнивается с критическим значением при заданном
уровне значимости (a)
и числе степеней свободы k=s-1, где s – число групп (интервалов).
Если <
- нулевую
гипотезу не отвергаем.
Для других распределений K=S-m-1, где m- число параметров, рассчитанных по данным
выборки.
Для равномерного распределения m=0
Для распределения Пирсона m=1.