Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по МС.doc
Скачиваний:
6
Добавлен:
29.08.2019
Размер:
507.9 Кб
Скачать

§ 4 Проверка статистических гипотез

Определение. Статистической называют гипотезу о виде неизвестного распределения или о параметрах известного распределения.

Определение. Простой называют гипотезу, содержащую только одно предположение.

Определение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

При статистической проверке гипотезы можно допустить следующие ошибки:

  1. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза (казнь невиновного).

  2. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза (оправдание преступника).

Замечания: 1. Вероятность совершить ошибку первого рода называют уровнем значимости и обозначают . Обычно его принимают равным 0,05 или 0,01. Если принят уровень значимости , то это значит, что примерно в одном случае из ста можно допустить ошибку первого рода.

2. Вероятность допустить ошибку второго рода обозначают , а число называют мощностью критерия. Из определения ошибок следует, что для уменьшения возможности допустить ошибки первого и второго рода эксперимент следует проводить с большей выборкой.

Определение. Статистическим критерием называют случайную величину , по значениям которой судят о справедливости нулевой гипотезы.

Определение. Наблюдаемым значением называют значение статистического критерия, вычисленное по выборочным данным.

После выбора некоторого критерия проверки статистической гипотезы множество всех его возможных значений разбивают на два непересекающихся подмножества. Если наблюдаемое значение критерия попадает в первое подмножество (область принятия гипотезы), то основная гипотеза принимается. Если во второе подмножество (критическая область), то основная гипотеза отвергается. Точки, разделяющие эти подмножества, называют критическими.

Для проверки статистической гипотезы выполняют следующие шаги:

  1. Ранжируют данные.

  2. Строят статистический ряд.

  3. Вычисляют теоретические вероятности попадания в каждый интервал группирования по формуле: , где − плотность распределения вероятности и − длина интервала группирования количественного признака .

  4. Вычисляют теоретические частоты по формуле: (округляя до целого).

  5. Задают уровень значимости .

  6. Определяют критическую точку (правосторонняя критическая область), исходя из условия , и количества степеней свободы , где − количество интервалов группирования признака, − количество параметров рассматриваемого распределения; например, для нормального распределения , т.к. оно определяется двумя параметрами – математическим ожиданием и средним квадратическим отклонением.

  7. Вычисляют по выборке наблюдаемое значение критерия.

  8. Если наблюдаемое значение больше критического, то гипотезу отвергают; в противном случае, нет оснований отвергнуть гипотезу (отвергают гипотезу более категорично, чем принимают).

В качестве критерия проверки статистических гипотез будем рассматривать критерий Пирсона (хи-квадрат), который наиболее широко применяется для этой цели.

Для определения критических точек распределения при различных уровнях значимости и степенях свободы составлены специальные таблицы.

Определение. Наблюдаемым значением критерия Пирсона называется величина .

Пример. Для нашей выборки проверить гипотезу при уровне значимости , если предположить, что количественный признак генеральной совокупности распределен нормально.

Решение.

Нормальное распределение имеет плотность , полагая и найдем теоретические вероятности по формуле .

Теоретические вероятности (для проверки гипотезы о нормальном распределении количественного признака генеральной совокупности) можно так же вычислять по формуле , где − функция стандартного нормального распределения.

Вычисляют теоретические частоты по формуле: (округляя до целого).

Наблюдаемым значением критерия Пирсона вычисляем по формуле .

Занесем все данные в следующую таблицу:

Номер интер- вала

Частоты

пi

Теоретич. вероятности

Теоретич. частоты

Компоненты

1

1

0,015

1

0

2

4

0,070

3

0,33

3

8

0,192

10

0,4

4

16

0,296

15

0,07

5

12

0,258

13

0,08

6

7

0,127

6

0,17

7

2

0,035

2

0

50

0,992

50

1,05


Наблюдаемое значение критерия равно: 1,05. Число степеней свободы равно: . По таблице находим: . Так как наблюдаемое значение критерия меньше, чем критическое (т.е. теоретическое значение), то делаем вывод, что нет оснований отвергнуть гипотезу о нормальном распределении.