Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория Вероятностей 2 курс 1 вариант

.pdf
Скачиваний:
17
Добавлен:
19.08.2022
Размер:
7.65 Mб
Скачать

Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

8 = * +

, +

( , +) + ( , &)

где x0 – начало модального интервала; h – величина интервала; f2 – частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

Выбираем в качестве начала интервала 60, так как именно на этот интервал приходится наибольшее количество.

43 − 378 = 60 + 2 (43 − 37) + (43 − 39) = 61.2

Наиболее часто встречающееся значение ряда – 61.2

Медиана.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 60 - 62, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

= * +

 

 

(

7

"9-+ )

"9

2

= 60 +

2

(

240

− 107 ) = 60.605

43

2

 

Таким образом, 50% единиц совокупности будут меньше по величине 60.605.

В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ≈ xср-Mo

Среднее значение изучаемого признака по способу моментов.

̅=

77

+

7

где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала.

7= 7

Находим А = 61 Шаг интервала h = 2

Средний квадрат отклонений по способу моментов.

=

[/#

]!∙=#

x

,

,

fi

x ifi

[x i] fi

∑ =#

 

+ ( ̅− x)i

 

ц

 

 

∙ 2

 

 

 

 

 

 

 

 

 

 

 

51

-5

5

-25

125

 

 

 

53

-4

12

-48

192

 

 

 

55

-3

21

-63

189

 

 

 

57

-2

32

-64

128

 

 

 

59

-1

37

-37

37

 

 

 

61

0

43

0

0

 

 

 

63

1

39

39

39

 

 

 

65

2

19

38

76

 

 

 

67

3

15

45

135

 

 

 

69

4

8

32

128

 

 

 

71

5

5

25

125

 

 

 

73

6

4

24

144

 

 

 

 

 

 

240

-34

1318

 

 

 

 

 

̅=

−34

 

 

 

 

 

 

 

240 ∙ 2 + 61 = 60.717

 

= 1318240 ∙ 2, − (60.717 − 61), = 21.886

Среднее квадратическое отклонение.

= √ = √21.886 = 4.678

Показатели вариации.

Абсолютные показатели вариации.

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = xmax - xmin = 74 - 50 = 24

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

=∑ |/# - | • =#=66#.&)#= 3.697

=# ,$*

Каждое значение ряда отличается от другого в среднем на 3.697 Дисперсия - характеризует меру разброса около ее среднего значения

(мера рассеивания, т.е. отклонения от среднего).

=∑(/# - /̅)! =#=(,(,.#&&= 21.886

=# ,$*

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

, =

∑(/# - /̅)!∙=#

=

(,(,.#&&

= 21.978

∑ =#-+

,&E

Среднее квадратическое отклонение.

= √ = √21.886 = 4.678

Каждое значение ряда отличается от среднего значения 60.717 в среднем на 4.678

Оценка среднеквадратического отклонения.

= e , = √21.978 = 4.688

Интервальное оценивание центра генеральной совокупности. Доверительный интервал для генерального среднего.

( ̅− !F

 

; ̅+ !F

 

)

В этом случае 2Ф(tkp) = γ Ф(tkp) = γ/2 = 0.8/2 = 0.4

По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) =

0.4

tkp(γ) = (0.4) = 1.29

Стандартная ошибка выборки для среднего:

G =

 

=

4.688

= 0.3026

√240

Стандартная ошибка среднего указывает, на сколько среднее выборки 60.717 отличается от среднего генеральной совокупности.

Предельная ошибка выборки:

4.688

= !F = 1.29 ∙ √240 = 0.39

или

ε = tkp sc = 1.29∙0.303 = 0.39 Доверительный интервал:

(60.717 - 0.39;60.717 + 0.39) = (60.326;61.107)

С вероятностью 0.8 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Проверка гипотез о виде распределения.

1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

= j ( 7 7,

7

где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону

Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа

Ф(

70+

− ̅

7

− ̅

 

) − Ф(

 

 

)

где

s = 4.678, xср = 60.717

Теоретическая (ожидаемая) частота равна fi = fpi, где f = 240 Вероятность попадания в i-й интервал: pi = Ф(x2) - Ф(x1)

xi÷xi+1

fi

x1 = (xi

x2 =

Ф(x1)

Ф(x2)

pi=Ф(x2)-

Ожидаемая

Слагаемые

 

 

- xср)/s

(xi+1 -

 

 

Ф(x1)

частота,

статистики

 

 

 

xср)/s

 

 

 

240pi

Пирсона,

 

 

 

 

 

 

 

 

Ki

50 - 52

5

-2.2859

-1.8593

-0.4893

-0.4686

0.0207

4.968

0.000206

52 - 54

12

-1.8593

-1.4327

-0.4686

-0.4251

0.0435

10.44

0.2331

54 - 56

21

-1.4327

-1.0061

-0.4251

-0.3438

0.0813

19.512

0.1135

56 - 58

32

-1.0061

-0.5795

-0.3438

-0.219

0.1248

29.952

0.14

58 - 60

37

-0.5795

-0.1529

-0.219

-0.0636

0.1554

37.296

0.00235

60 - 62

43

-0.1529

0.2737

-0.0636

0.1103

0.1739

41.736

0.03828

62 - 64

39

0.2737

0.7004

0.1103

0.2611

0.1508

36.192

0.2179

64 - 66

19

0.7004

1.127

0.2611

0.3708

0.1097

26.328

2.0396

66 - 68

15

1.127

1.5536

0.3708

0.4406

0.0698

16.752

0.1832

68 - 70

8

1.5536

1.9802

0.4406

0.4767

0.0361

8.664

0.05089

70 - 72

5

1.9802

2.4068

0.4767

0.4922

0.0155

3.72

0.4404

72 - 74

4

2.4068

2.8334

0.4922

0.4977

0.0055

1.32

5.4412

 

240

 

 

 

 

 

 

8.9007

Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.

Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).

Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).

Kkp = χ2(12-2-1;0.05) = 16.91898; Kнабл = 8.9

Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.

Выводы:

Каждое значение ряда отличается от среднего значения 60.717 в среднем на 4.678.

Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.

Проверка гипотезы по критерию согласия Пирсона показала, что нет оснований отвергать гипотезу о нормальном законе распределения.

Функция распределения F(X). F(x≤50) = 0

F(50<x≤52) = 0 + 0.020833333333333 = 0.020833333333333 F(52<x≤54) = 0.020833333333333 + 0.05 = 0.070833333333333 F(54<x≤56) = 0.070833333333333 + 0.0875 = 0.15833333333333 F(56<x≤58) = 0.15833333333333 + 0.13333333333333 =

0.29166666666667

F(58<x≤60) = 0.29166666666667 + 0.15416666666667 = 0.44583333333333

F(60<x≤62) = 0.44583333333333 + 0.17916666666667 = 0.625 F(62<x≤64) = 0.625 + 0.1625 = 0.7875

F(64<x≤66) = 0.7875 + 0.079166666666667 = 0.86666666666667 F(66<x≤68) = 0.86666666666667 + 0.0625 = 0.92916666666667 F(68<x≤70) = 0.92916666666667 + 0.033333333333333 = 0.9625 F(70<x≤72) = 0.9625 + 0.020833333333333 = 0.98333333333333 F(72<x≤74) = 0.98333333333333 + 0.016666666666667 = 1 F(x>74) = 1