Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладная статистика

..pdf
Скачиваний:
7
Добавлен:
12.11.2023
Размер:
9.53 Mб
Скачать

8.4*3, Коэффициент ранговой корреляции Кендэла

М. Кендал (английский статистик с мировым именем) пред­ ложил другой коэффициент ранговой корреляции х. Он вы­ числяется ло двумерной выборке рангов следующим образом.

Столбцы переставляются так, чтобы ранги х 1 образовали

возрастающую последовательность 1 , 2 Теперь х| = I. Для

каждого рангау, обозначим черезр 1 число рангов^ > у %>причем к > I; через ц 4 обозначим число р а н г о в п р и ч е м к > /.

Пусть: Р ^ р

; ,

0 = Е ? ,;

5 = Р - 0 .

Коэффициент г вычисляется по одной из эквивалентных

ФЧ" ’У' :

2

5 _

___ 40 _____

Х

и (л -

1)

п(п -

1) л(л - 1)

,т.

 

 

„ ^

/|(и - |)ч

(Нетрудно показать, что

Р + д = — -— ).

Число т лежит в пределах-11 т < 1, причем т = 1, если х , = у ё 1 = 1,2, ...,и ;т = -1,ссл и х[ +>», = н + 1,1е 1,2,

Пример вычисления т для рангов из табл. 8.3 приведен в

табл. 8.5:

 

 

 

№л/л

 

Ршяги

Р*

 

У:

10

1

1

9

9

2

3

7

В

3

2

7

7

А

4

6

5

Ь

5

5

б

б

7

3

2

7

б

3

1

8

9

1

3

9

В

1

А

10

10

0

Сумма

55

55

Р —А2

Таблица 3.5

%

0

\

0

0

0

1

0

1

0

0 с» II «'О

191

т = 2 x 3 9

3 x 4

42 х 4 - I = 0,87.

90

90

90

Коэффициенты Спирмена и Кендэла никак не связаны между собой. Обычно г%> т, но сравнение этих коэффициентов нс дает никакой дополнительной: информации о связи между рангами.

Значимость коэффициента ранговой корреляции Кендэла (# в: в генеральной совокупности т = 0) при л > 10 проверяется при помощи статистики:

2(2 л + 5) 1

9п{н - 1)

которую можно считать приближенно нормально распределен­ ной со средним М(К) = 0 и дисперсией й(к) = 1 (если верна ну­ левая гипотеза). Для нашего примера при # в: т > 0 и а = 0,05 по

таблице функции Лапласа находим, что

= 1,65. Между тем:

9 * 1 0 (1 0 -])

 

Нулевую гипотезу следует отвергнуть.

 

8.4.4. Коэффициент конкордацин Кендэла

Пусть т экспертов независимо один от другого ранжируют п элементов по некоторому признаку. Каждый получает свою

выборку рангов, всего выборок т. Обозначим через

ранг,

приписанный ;'-ыу элементуу-м экспертом, г = 1, 2,

и, у = 1,

2....... т. Чтобы оценить, насколько хорошо мнения экспертов согласуются между собой, М. Кендэл определил следующий ко­ эффициент конкордацин (согласованности) IV:

192

сумма рангов приписанных всеми экспертами *-му элементу, минус среднее значение этих сумм рангов.

При наличии с в я з а н н ы х рангов коэффициент ^вычисляется по формуле;

'2 ± 1 > 1

,

.

П' = — — -*=]------------> ГДО

5 = Т . 1 Вк ~ Вк \

т 2 (гг3 - и) - тВ

* =|

 

где 2 —- число связок рангов, ВК— число связанных рангов в к-й связке= ], 2,

Коэффициент V/ принимает значения в интервале 0 й IV < I, причем IV = ], когда мнения экспертов полностью совпадают, IV = 0, когда мнения экспертов полностью рассогласованы (ни­ какой элемент нс имеет двух одинаковых рангов).

Пример. Три эксперта оценивают качество шести изделий = 3, = 6). Результаты оценки и дальнейшие расчеты приведе­

ны л табл. 8.6:

 

— =10.1

;В = (21- 2) + (3* - 3) = 30,

6

 

IV =

12x133

= 0,881-

32(0э - 6 ) - 3 х 3 0

Значение - 0,887 близко к 1, мнения экспертов хорошо согласуются. Для проверки значимости коэффициента конкордацни используют статистику:

п Ъ о }

X2 = »к» - О »'

________ /И _________

ши (л + 1 ) - В /(« - 1 )

Если справедлива нулевая гипотеза, статистика %2 имеет рас­ пределение х 2 с г = и - I степенями свободы.

193

 

 

 

 

 

 

Таблица3.6

Издои[

 

Эксперту

 

 

Суммарангов

 

 

 

 

 

 

 

1

2

3

Л1

 

V

 

 

 

 

 

 

 

 

 

 

 

1

1

2

1

4

-6,5

42,25

2

2

1

3

6

-4,5

20,25

3

4

4,5

3

11.5

1.0

1,00

4

5

4,5

6

15,5

5,0

25,00

5

3

3

3

9

-1,5

2,25

6

6

6

5

17

6,5

42,25

Сумма

21

21

21

63

133.00

В нашем случае х2„сп -

3(6-1)*0,887 = 13,3; г = 5, положим

а = 0,05, тогда у 2

= 11,1 < %\пп- Нулевая гипотеза отвергался,

оценки экспертов можно считать согласованными.

 

 

 

8.5* ЗАДАЧИ

 

 

1.

Большая партия изделии может содержать некоторую долю

дефектных. Поставщик утверждает, что эта доля составляет 5%; покупатель предполагает, что доля дефектных изделий больше. Из партии случайным образом отбираются и проверяются 10 изделии; партия принимается, если при проверке обнаружено не более одно­ го дефектного изделия. В противном случае партия возвращается поставщику. Описать ситуацию в терминах теории проверки ста­ тистических гипотез и ответить на следующие вопросы:

а) Каковы нулевая и альтернативная гипотезы?

б) Каков закон распределения теста, применяемого для про­ верю] нулевой гипотезы?

в) Каковы критическая область и область принятия нулевой гипотезы?

г) В чем заключается ошибка первого рода и какова ее веро­ ятность?

194

д)

Если долл дефектных изделий в партии на самом деле рав­

на 10%, то какова вероятность ошибки второго рода?

2.

В аттракционе на ярмарке аттракцион нет предъявляет

колоду из 10 карт, среди которых, как он утверждает, два туза (нулевая гипотеза). Игрок извлекает одну карту из тщательно перетасованной колоды. Если извлекается туз, игрок получает назад свои деньги плюс призовую сумму. Некто полагает, что в колоде на самом деле тузон нс более одного. Для проверки он наблюдает результаты 10 последовательных игр:

а) Описать закон распределения теста, использованного для проверки нулевой гипотезы.

б> Описать область прнютия пулевой гипотезы и критичес­ кую область, если а = 0,1.

в) Какова вероятность ошибки второго рода, если в колоде на самом деле всего один туз?

3. Школьная администрация обеспокоена тем обстоятельс­ твом, что, когда детям на завтрак подастся шпинат, они плохо сю сляг. Продавец замороженного шпината утверждает, что 80% детей будут есть этот шпинат, который, однако, несколько дороже. Чтобы проверить это предположение, 10 случайно отоб­ ранным детям предлагают попробовать новый сорт шпината:

а) Каковы нулевая и альтернативная гипотезы?

б) Каков закон распределения теста, использованного для проверки нулевой гипотезы?

в) Выбрать уровень значимости а и построить область при­ нятия нулевой гипотезы н критическую область. Если 7 детей съедят шпинат, будет л и принята # а?

г) Найти вероятность ошибки второго рода» если в среднем только половине школьников нравится замороженный шпинат?

4. Бросают 5 монет. Некто подозревает, что в этой пятерке есть монеты с гербом с двух сторон (двугербовые).

Известно, что монета может быть либо правильной, либо двугербовой. Предлагается следующая процедура проверки нулевой гипотезы о том, что все монеты правильные: нулевая гипотеза принимается, если прк одновременном бросании этих пяти монет менее четырех выпадут гербом кверху. Найти веро-

195

ятность ошибки первого рода. Какова вероятность ошибки вто­ рого рода, если из пяти монет две дву гербовые?

5.Ответить на вопросы задачи 4, если процедура проверки нулевой гипотезы такова: из данных пяти монет случайным об­ разом выбирается одна и затем подбрасывается три раза. Нуле­ вая гипотеза отвергается, если герб выгыдает псе три раза.

6.В эксперименте с дегустированием кофе каждому испытуе­ мому предлагается попробовать кофе в 10 парах чашек. В каждой парс одна чашка содержит кофе первого сорта, одна — второго. Испытуемый должен определить, в какой чашке находится кофе первого’ сорта. Если он правильно определяет сорт кофе нс ме­ нее 8 раз из 10, его приглашают на работу в качестве дегустатора кофе. Каковы шансы получить работу случайно угадывающему человеку? Какой должна быть нулевая гипотеза относительно ве­ роятности Р правильно угадать сорт кофе, чтобы уровень значи­ мости предложенного критерия нс превосходил 0,05?

7.В урне содержатся неотличимые на ощупь черные и белые шары. Предполагается, что число черных шаров равно числу бе­ лых. Эта гипотеза принимается, если при извлечении 50 шаров (с возвращением) число черных будет в пределах от 20 до 30.

Какова вероятность ошибки первого рода? Какова вероят­ ность ошибки второго рода, если вероятность появления черно­ го шара равна 1/3?

8.Из продукции автомата, обрабатывающего болты с номи­ нальным значением контролируемого размера а - 40 мм, была взята выборка болтов объема п = 36. Выборочное среднее кон­ тролируемого размера х = 40,2 мм. Результаты предыдущих из­ мерений дают основание предполагать, что действительные размеры болтов имеют нормальное распределение с дисперсией

а2 = 1 мм2. Можно пи по результатам приведенного выбороч­ ного обследования утверждать, что контролируемый размер нс имеет положительного смещения по отношению к номинально­ му размеру? Принять а - 0,01.

9.Пусть в условиях задачи 8 партия болтов бракуется, если выборочное среднее контролируемого размера будет больше 40,1 мм. Выполнить следующие задания:

196

а) Найти вероятность ошибки первого рода, если решение принимается но выборке объема и = 36.

б) Какова вероятность ошибки второго рода, если а = 40,3 мм? Объем выборки л = 36.

10.Решить задачу 9, если партия болтов бракуется при вы­

полнении одного из Ешравснств: х > 40, I мм и х <. 39,9 мм, где

л— выборочное среднее контролируемого размера.

И. Длительное наблюдение за производственным процес­ сом изготовления химической смеси привело к заключению, что величину выпуска можно считать нормально распределен кой случайной величиной со средним значением 250 единиц в еди­ ницу времени н средним квадратическим отклонением 50 еди­ ниц. Производственный процесс был модифицирован, причем модификация не изменила величину среднего квадратического отклонения. При уровне значимости а = 0,05 проверяется ну­ левая гипотеза о том, что среднее значение выпуска продукции не изменилось против альтернативной, что выпуск продукции увеличился. Выполнить следующие задания:

л) Найти критическую область при 25 наблюдениях.

б) Известно, что число наблюдений п - 25, а модификация процесса привела к увеличению среднего выпуска продукции до 260 единиц в единицу времени. Найти вероятность отвергнуть нулевую гипотезу.

в) Найти такое число наблюдений, которое необходимо взять, чтобы вероятность отвергнуть нулевую гипотезу при условии, что произошло увеличение среднего выпуска продукции до 260 единиц, была бы нс меньше ОД

12.Торговый контролер, в задачу которого входит контроль за правильной массой отдельных товаров, отобрал 10 однофунтешых пакетов с кофе н взвесил содержимое каждого из них. Он получил такие результаты (фунты): 0,94; 0,95; 0,92; 1,02; 0,97; 0,95; 1,02; 0,96; 0,92; 0,97. Если окажется, что средняя масса па­ кета меньше 1, то контролер должен сделать замечание магази­ ну. Будет ли сделано замечание? Положить а = 0,05.

13.Торговый инспектор отобрал в магазине 10 однофун­ товых пакетов с кофе н взвесил их содержимое. Результаты

197

(фунты) таковы: 0,89; 0,90; 0,87; 0,97; 0,92; 0,90; 0,97; 0,91; 0,87; 6,92. При уровне значимости а = 0,05 проверить нулевые гипо­ тезы Н': а - I и Я^: а = 0,95 прп альтернативных Нг: о < I и Я : а < 0,95 соответственно — средняя масса пакета с кофе).С до­ верительной вероятностью р - 6,95 оценить, сколько футггов кофе понадобится владельцу магазина, чтобы наполнить 1000 пакетов, если он будет продолжать делать это так же, как и раньше?

14.Количество бракованных изделий в партии еюдолжно пре­ вышать 5%. Из этой партии было случайным образом отобрано 100 изделий, 6 штук оказались бракованными. Можно ли считать, что процент брака превосходит допустимый, если а - 0,01?

15.При проведении телепатического опыта индуктор неза­ висимо от предшествующих проб выбирает один из двух пред­ метов и думает о нем, а реципиент пытается угадать мысли ин­ дуктора. Опыт был повторен 100 раз, причем было получено 60 правильных ответов. Можно ли приписать полученный резуль­

тат чисто случайному совпадению?

16.В случайной выборке, состоящей из 900 темноволосых лю­ дей, 150 человек имеют голубые глаза. Доля голубоглазых людей среди всего населения равна 0,25. Проверить гипотезу о том, что доля темноволосых людей с голубыми глазами меньше, чем долл голубоглазых среди всего населения. Положить а = 0,05.

17.Известно, что 5% всех застраховавших свою жизнь умира­ ет по достижении 60 лет. В группе из 1000 человек этого возрас­ та, работающих в строительстве, умерло 68. Проверит!» гипотезу

отом, что застрахованные люди, работающие в строительстве, умирают чаще в 60 лет, чем все остальные застрахованные,

18.Фирма, производящая новый вид лекарства от гриппа, объ­ явила, что оно излечивает от болезни менее чем за 4 дня и его эффективность равна 95%. В случайной выборке из 300 человек, заболевших гриппом и принимающих это лекарство, 272 попра­ вились менее чем за 4 дня. Было ли заявление фирмы состоятель­ ным? Какова вероятность ошибки 2-го рода, если вероятность вы­ здороветь менее чем за 4 дня на самом деле равна 0,9?

19.Пусть уровень значимости а = 0,05; Я а: р =■0,1; Я : р > >0,1. Найти вероятность ошибки 2-го рода, сслк на самом деле:

а) р = 0,15; б= 0,12. Объем выборки п = 100.

198

20. Пусть //,= //,= 200; Нй. р { = р2\ // : р, Ф р2; а = 0,05; дг,= 0,4; *2 = 0,6. Будет ли принята нулевая гипотеза? Каким ока­ жется ответ, если х, = 0,48; х2 - 0,52?

21.

Пусть И0:

Иш: р г Фр2; а = 0,05; *,= 0,2; хг * 0,25.

Найти

= н2, чтобы разница между выборочными средними

позволила отвергнуть нулевую гипотезу.

22.

На двух, аналитических весах в одном и том же порядке

взвешены 10 проб химических веществ н получены следующие результаты взвешивания (мг):

А‘.

25

30

28

50

20

40

32

36

42

38

 

28

31

26

52

24

56

33

35

45

40

При уровне значимости 0,01 установить, значимо или незна­ чимо различаются результаты взвешиваний в предположении, что они распределены нормально?

23. Физическая подготовка 9 спортсменов была проверена при поступлении в спортивную школу, а затем после недели тренировок. Итоги проверки в баллах оказались следующими (в первой строке указано число баллов, подученных каждым спорт­ сменом при поступлении в школу, во второй после обучения):

А'.

76

71

57

49

70

69

26

65

59

 

81

85

52

52

70

63

33

83

62

При уровне значимости 0,05 установить, значимо или незна­ чимо улучшилась физическая подготовка спортсменов. Считать, что балл, полученный спортсменом, нормально распределенная случайная величина.

24. Новую технику изготовления резиновых трубок прове­ ряют следующим образом. Пару трубок (одна из которых изго­ товлена по старому методу, а вторая — по новому) обрабатыва­ ют различными видами кислот. Данные о сроке службы трубок (годы) следующие:

Тип кислоты

 

1

2

3

4

5

6

7

8

9

10

Срок с л у ж

б ы т р у б

о к , ю г о т о в -

1,7

4,6

3,7

3,9

2,8

3,1

2,4

4,2

3,6

3,3"

Л С 1 Ш Ы Х п о

н о в о м у

методу

 

 

 

 

 

 

 

 

 

 

Срокслужбытрубок, изготов­

1,2

4,4

3,1

4,0

2,4

2,7

2,6

3,7

3,5

3,0

ленных по старому методу

 

 

 

 

 

 

 

 

 

 

Улучшает ли новая технология качество изготовления ре­ зиновых трубок? Предполагается, что срок службы резиновых трубок — нормально распределенная случайная величина. Как ответить на поставленный вопрос, если закон распределения срока службы неизвестен? Положить а = 0,05.

25. Для проведен11ЯсеяьскохозяГ[стве1шогоэкспср|1мсн’1Ткбыло выбрано небольшое поле из 25 участков. Каждый участок был разделен на2 равные части; случайным образом выбиралась одна половина и засеивалась первым сортом пшеницы, другая часть засеивалась вторым сортом. Урожайность измерили и записали разности для каждого участка (урожайность пшеницы второго сорта минус урожайность пшеницы первого сорта).Выборочное среднее разностей оказалось равным 3,5* 103 м3/км2, а выборочное среднее квадратическое отклонение равно 0,4><103 м,/км2. Даст ли второй сорт пшеницы существенно большую урожайность, чем первый? Положить а = 0,05 и считать, что урожайность пшеницы нормально распределенная случайная величина.

26. Исследовалась растяжимость некоторого вида резины после химической обработки. Было отобрано и пронумеровано шесть мотков резины. Каждый отобранный моток был разделен пополам, одна половина подвергалась химической обработке, другая — нет. Затем было измерено растяжение (%) двенадцати

кусков резины. Результаты представлены в таблице:

 

Вид резаны

 

 

Исследуемый кусок

 

 

1

2

3

4

5

6

 

Обработанная

18,1

17,3

19,1

17,2

16,7_

[Необработанная

16,3

17,0

18,4

17,6

17,0

16,0

200