Имея две гипотезы H0 и H1, необходимо на основе выборочных данных либо принять основную гипотезу H0, либо конкурирующую H1.
Правило, по которому принимается решение принять или отклонить гипотезу H0 (или H1), называется статистическим критерием (или просто критерием) проверки гипотезы H0.
Статистикой (или тестом) критерия называют случайную величину τ, которая служит для проверки статистических гипотез.
Для каждого критерия имеются соответствующие таблицы, по которым и находят критическое значение, удовлетворяющее приведённым выше соотношениям.
Принцип принятия статистической гипотезы не даёт логического доказательства её верности или неверности. Принятие гипотезы H0 в сравнении с альтернативной H1 не означает, что мы уверены в абсолютной правильности H0 или что высказанное в гипотезе H0 утверждение является наилучшим, единственно подходящим; просто гипотеза H0 не противоречит имеющимся у нас выборочным данным, таким же свойством наряду с H0 могут обладать и другие гипотезы. Более того, возможно, что при увеличении объёма выборки п или при испытании H0 против другой альтернативной гипотезы H2 гипотеза H0 будет отвергнута.
Таким образом, принятие гипотезы H0 следует расценивать не как раз и навсегда установленный, абсолютно верный содержащийся в ней факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.
Из представленной схемы следует, что при проверке гипотезы H0 может быть принято неправильное решение, т.е. могут быть допущены ошибки двух видов:
ошибка I рода |
ошибка II рода |
Отвергается основная (нулевая) гипотеза, хотя она верна. |
Отвергается конкурирующая гипотеза, хотя она верна. |
Вероятность ошибки , α – уровень значимости критерия (обычно α = 0,05; 0,01; 0,005; 0,001). |
Вероятность ошибки
(величина β, как правило, заранее неизвестна) |
Вероятность принять верную (нулевую) гипотезу . |
Вероятность принять верную (конкурирующую) гипотезу , (1 – β ) – мощность критерия. |
Последствия ошибок 1-го и 2-го рода могут быть абсолютно различными: в одних случаях надо минимизировать α, а в другом – β. Так, применительно к радиолокации говорят, что α – вероятность пропустить сигнал, β – вероятность ложной тревоги; применительно к производству, к торговле можно сказать, что α – риск поставщика (т. е. забраковка по всей партии изделий, удовлетворяющих стандарту), β – риск потребителя (т.е. приём по выборке всей партии изделий, не удовлетворяющих стандарту); применительно к судебной системе, ошибка 1-го рода приводит к оправданию виновного, ошибка 2-го – осуждение невиновного.
Следует отметить, что одновременное уменьшение ошибок 1-го и 2-го рода возможно лишь при увеличении объёма выборок. Поэтому обычно при заданном уровне значимости α отыскивается критерий с наибольшей мощностью.