При проверке статистических гипотез возможны два типа ошибок:
Ошибка первого рода происходит, когда нулевая гипотеза (H₀) отвергается, хотя на самом деле она истинна. Это ошибочное обнаружение эффекта там, где его нет. Вероятность ошибки первого рода обозначается через α, что также является уровнем значимости теста.
α устанавливается заранее, и обычно составляет 0.05 или 5%, что означает, что исследователь принимает 5% шанс на ошибочное отклонение нулевой гипотезы.Ошибка второго рода возникает, когда нулевая гипотеза (H₀) не отвергается, хотя на самом деле она ложна. Это пропуск существующего эффекта. Вероятность ошибки второго рода обозначается как β, и величина 1 - β называется статистической мощностью теста.
Обе ошибки являются важными аспектами проверки гипотез и обычно зависят от уровня значимости α и статистической мощности теста 1 - β. Снижение одной ошибки часто ведет к увеличению вероятности другой, и баланс между ними зависит от цели исследования.
Доверительный интервал — это диапазон значений, в котором с определенной степенью уверенности (обычно 95% или 99%) ожидается нахождение истинного значения параметра. Доверительный интервал используется для оценки параметров, таких как среднее или доля.
Доверительный интервал для параметра θ определяется как интервал, содержащий оценку параметра с заданным уровнем доверия. Например, для 95%-го доверительного интервала можно ожидать, что истинное значение параметра находится внутри этого интервала в 95% случаев.
[θ̂ - Z * σ/√n , θ̂ + Z * σ/√n]
где:
θ̂ — оценка параметра (например, выборочное среднее).Z — Z-значение, соответствующее уровню доверия (например, 1.96 для 95% доверительного интервала).σ — стандартное отклонение выборки.n — размер выборки.Пусть у нас есть выборка из 100 человек, и выборочное среднее артериального давления равно 120 с выборочным стандартным отклонением 15. Для построения 95%-го доверительного интервала для среднего артериального давления в генеральной совокупности используем формулу:
[120 - 1.96 * (15 / √100), 120 + 1.96 * (15 / √100)]
Это дает доверительный интервал [117.06, 122.94], что означает, что с 95%-й уверенностью истинное среднее артериальное давление находится в этом интервале.
Ошибки первого и второго рода являются важными характеристиками проверки гипотез, указывающими на вероятность неправильного заключения. Доверительные интервалы, в свою очередь, позволяют оценить диапазон значений, в которых может находиться истинный параметр, с определенной степенью уверенности. Эти понятия играют ключевую роль в статистическом анализе и позволяют исследователям делать обоснованные выводы на основе данных.