Теория Вероятностей 2 курс 1 вариант
.pdfМода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
8 = * + |
, − + |
( , − +) + ( , − &) |
где x0 – начало модального интервала; h – величина интервала; f2 – частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 60, так как именно на этот интервал приходится наибольшее количество.
43 − 378 = 60 + 2 (43 − 37) + (43 − 39) = 61.2
Наиболее часто встречающееся значение ряда – 61.2
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 60 - 62, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
= * + |
|
|
( |
∑ 7 |
− "9-+ ) |
|
"9 |
2 |
|||||
= 60 + |
2 |
( |
240 |
− 107 ) = 60.605 |
||
43 |
2 |
|
Таким образом, 50% единиц совокупности будут меньше по величине 60.605.
В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ≈ xср-Mo
Среднее значение изучаемого признака по способу моментов.
̅= |
7∙ ∙ 7 |
∙ |
+ |
∑ 7 |
где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала.
7∙ = 7 −
Находим А = 61 Шаг интервала h = 2
Средний квадрат отклонений по способу моментов.
= |
[/#∙ |
]!∙=# |
x∙ |
, |
, |
fi |
x ifi |
[x i] fi |
∑ =# |
|
+ ( ̅− x)i |
||||||
|
ц |
|
∙ |
|
∙ |
∙ 2 |
||
|
|
|
|
|
|
|
|
|
|
|
|
51 |
-5 |
5 |
-25 |
125 |
|
|
|
|
53 |
-4 |
12 |
-48 |
192 |
|
|
|
|
55 |
-3 |
21 |
-63 |
189 |
|
|
|
|
57 |
-2 |
32 |
-64 |
128 |
|
|
|
|
59 |
-1 |
37 |
-37 |
37 |
|
|
|
|
61 |
0 |
43 |
0 |
0 |
|
|
|
|
63 |
1 |
39 |
39 |
39 |
|
|
|
|
65 |
2 |
19 |
38 |
76 |
|
|
|
|
67 |
3 |
15 |
45 |
135 |
|
|
|
|
69 |
4 |
8 |
32 |
128 |
|
|
|
|
71 |
5 |
5 |
25 |
125 |
|
|
|
|
73 |
6 |
4 |
24 |
144 |
|
|
|
|
|
|
|
240 |
-34 |
1318 |
|
|
|
|
|
̅= |
−34 |
|
|
|
|
|
|
|
240 ∙ 2 + 61 = 60.717 |
|
= 1318240 ∙ 2, − (60.717 − 61), = 21.886
Среднее квадратическое отклонение.
= √ = √21.886 = 4.678
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = xmax - xmin = 74 - 50 = 24
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
=∑ |/# - /̅| • =#=66#.&)#= 3.697
∑=# ,$*
Каждое значение ряда отличается от другого в среднем на 3.697 Дисперсия - характеризует меру разброса около ее среднего значения
(мера рассеивания, т.е. отклонения от среднего).
=∑(/# - /̅)! =#=(,(,.#&&= 21.886
∑=# ,$*
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
, = |
∑(/# - /̅)!∙=# |
= |
(,(,.#&& |
= 21.978 |
∑ =#-+ |
,&E |
Среднее квадратическое отклонение.
= √ = √21.886 = 4.678
Каждое значение ряда отличается от среднего значения 60.717 в среднем на 4.678
Оценка среднеквадратического отклонения.
= e , = √21.978 = 4.688
Интервальное оценивание центра генеральной совокупности. Доверительный интервал для генерального среднего.
( ̅− !F ∙ |
|
; ̅+ !F ∙ |
|
√ |
√ ) |
В этом случае 2Ф(tkp) = γ Ф(tkp) = γ/2 = 0.8/2 = 0.4
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) =
0.4
tkp(γ) = (0.4) = 1.29
Стандартная ошибка выборки для среднего:
G = |
|
= |
4.688 |
= 0.3026 |
√ |
√240 |
Стандартная ошибка среднего указывает, на сколько среднее выборки 60.717 отличается от среднего генеральной совокупности.
Предельная ошибка выборки:
4.688
= !F ∙ √ = 1.29 ∙ √240 = 0.39
или
ε = tkp sc = 1.29∙0.303 = 0.39 Доверительный интервал:
(60.717 - 0.39;60.717 + 0.39) = (60.326;61.107)
С вероятностью 0.8 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
= j ( 7 − 7)х,
7
где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
Ф( |
70+ |
− ̅ |
7 |
− ̅ |
|
|
) − Ф( |
|
|
) |
где
s = 4.678, xср = 60.717
Теоретическая (ожидаемая) частота равна fi = fpi, где f = 240 Вероятность попадания в i-й интервал: pi = Ф(x2) - Ф(x1)
xi÷xi+1 |
fi |
x1 = (xi |
x2 = |
Ф(x1) |
Ф(x2) |
pi=Ф(x2)- |
Ожидаемая |
Слагаемые |
|
|
- xср)/s |
(xi+1 - |
|
|
Ф(x1) |
частота, |
статистики |
|
|
|
xср)/s |
|
|
|
240pi |
Пирсона, |
|
|
|
|
|
|
|
|
Ki |
50 - 52 |
5 |
-2.2859 |
-1.8593 |
-0.4893 |
-0.4686 |
0.0207 |
4.968 |
0.000206 |
52 - 54 |
12 |
-1.8593 |
-1.4327 |
-0.4686 |
-0.4251 |
0.0435 |
10.44 |
0.2331 |
54 - 56 |
21 |
-1.4327 |
-1.0061 |
-0.4251 |
-0.3438 |
0.0813 |
19.512 |
0.1135 |
56 - 58 |
32 |
-1.0061 |
-0.5795 |
-0.3438 |
-0.219 |
0.1248 |
29.952 |
0.14 |
58 - 60 |
37 |
-0.5795 |
-0.1529 |
-0.219 |
-0.0636 |
0.1554 |
37.296 |
0.00235 |
60 - 62 |
43 |
-0.1529 |
0.2737 |
-0.0636 |
0.1103 |
0.1739 |
41.736 |
0.03828 |
62 - 64 |
39 |
0.2737 |
0.7004 |
0.1103 |
0.2611 |
0.1508 |
36.192 |
0.2179 |
64 - 66 |
19 |
0.7004 |
1.127 |
0.2611 |
0.3708 |
0.1097 |
26.328 |
2.0396 |
66 - 68 |
15 |
1.127 |
1.5536 |
0.3708 |
0.4406 |
0.0698 |
16.752 |
0.1832 |
68 - 70 |
8 |
1.5536 |
1.9802 |
0.4406 |
0.4767 |
0.0361 |
8.664 |
0.05089 |
70 - 72 |
5 |
1.9802 |
2.4068 |
0.4767 |
0.4922 |
0.0155 |
3.72 |
0.4404 |
72 - 74 |
4 |
2.4068 |
2.8334 |
0.4922 |
0.4977 |
0.0055 |
1.32 |
5.4412 |
|
240 |
|
|
|
|
|
|
8.9007 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = χ2(12-2-1;0.05) = 16.91898; Kнабл = 8.9
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.
Выводы:
Каждое значение ряда отличается от среднего значения 60.717 в среднем на 4.678.
Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.
Проверка гипотезы по критерию согласия Пирсона показала, что нет оснований отвергать гипотезу о нормальном законе распределения.
Функция распределения F(X). F(x≤50) = 0
F(50<x≤52) = 0 + 0.020833333333333 = 0.020833333333333 F(52<x≤54) = 0.020833333333333 + 0.05 = 0.070833333333333 F(54<x≤56) = 0.070833333333333 + 0.0875 = 0.15833333333333 F(56<x≤58) = 0.15833333333333 + 0.13333333333333 =
0.29166666666667
F(58<x≤60) = 0.29166666666667 + 0.15416666666667 = 0.44583333333333
F(60<x≤62) = 0.44583333333333 + 0.17916666666667 = 0.625 F(62<x≤64) = 0.625 + 0.1625 = 0.7875
F(64<x≤66) = 0.7875 + 0.079166666666667 = 0.86666666666667 F(66<x≤68) = 0.86666666666667 + 0.0625 = 0.92916666666667 F(68<x≤70) = 0.92916666666667 + 0.033333333333333 = 0.9625 F(70<x≤72) = 0.9625 + 0.020833333333333 = 0.98333333333333 F(72<x≤74) = 0.98333333333333 + 0.016666666666667 = 1 F(x>74) = 1