Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL

.pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
3.04 Mб
Скачать

 

 

 

 

 

 

 

 

 

 

 

 

χ2

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

 

=

ν1

1

.

 

 

 

 

 

 

 

 

 

 

(1.11)

 

 

 

 

 

 

 

 

χ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν1,ν2

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Распределение случайной величины

Fν ,ν

2

называется рас-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

пределением Фишера (Фишера – Снедекора)

 

с

ν1 1,

ν2 1

степенями свободы и имеет плотность вероятностей

 

 

 

 

 

 

 

 

0,

 

 

 

 

 

 

 

x 0 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν1 + ν2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

 

 

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

Γ

2

 

 

 

 

 

 

1

 

 

 

 

 

 

1

+1

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

2

 

 

 

 

x 2

 

 

 

 

 

 

 

 

 

 

f (x) =

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

,

x > 0.

(1.12)

Γ ν1

Γ

ν2

 

 

 

 

 

 

 

 

 

 

 

ν +ν

 

 

 

 

 

 

ν2

 

 

ν

 

1

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

+

1

x

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Плотность распределения для 4 комбинаций параметров ν1, ν2

приведена

на

рис. 1.14.

Математическое

 

ожидание

Fν ,ν

2

равно

 

 

 

 

 

 

 

 

 

 

 

2ν22 (ν1 2 2)

 

 

 

 

1

 

 

 

ν2

 

> 2, дисперсия–

 

 

 

при

ν2

> 4.

 

 

при ν2

 

 

ν2 2

ν1 (ν2 2)2 (ν2 4)

В MS Excel 2003 для работы с распределением Фишера используются следующие встроенные статистические функции

(см. прил. 2):

– FPACП (х; ν1; ν2) – возвращает одностороннее распределение FPACП = P{X > x} = 1 – F(x), где Х – случайная величина, соответствующая F-распределениюFν1,ν2 ;

– FРАСПОБР (р; ν1; ν2) – возвращает обратное значение для FPACП (х; ν1; ν2) (если p = FРАСП (x; ν1; ν2), то FРАСПОБР (p; ν1; ν2) = x), то есть квантиль x1–р для распределения Fν1,ν2 .

При определении критических точек F-распределения аналогично функции СТЬЮДРАСПОБР (р; k) нужно использовать уровень значимости α =1−β в качестве аргумента р для

FРАСПОБР (р; ν1; ν2).

31

Пример 1.6. Вычислить с помощью функции FPACП (х; ν1; ν2) функцию распределения F(x) и вероятности р = P{X>x} = = 1–F(x) для случайной величины Х, имеющей F-распределение для значений х: 1, 3, 5 и одинаковых степеней свободы ν1 = ν2 ≡ ν в диапазоне от 1 до 10. Для найденных значений р (для х = 3) с помощью функции FРАСПОБР (p; ν1; ν2) вычислить исходные значения х (критические точки для уровней значимости = р).

Рис. 1.14. Плотность распределения Фишера – Снедекора для разных комбинаций степеней свободы

1 F6;6; 2 F12;6; 3 – F6;60; 4 F6;2

Решение: Зададим в ячейки А1:G1 текстовые заголовки столбцов, в ячейки А2:А4 – заданные значения х, в В2:B11 – заданные значения ν, в C2 = 1–FРАСП($А$2;B2;B2), здесь использован фиксированный адрес ячейки А2, который не будет изменяться при последующем копировании формул. Анало-

гично в ячейку D2=1–FРАСП($А$3;B2;B2), в E2=1–FРАСП ($А$4;B2;B2), в F2=FРАСП($А$3;B2;B2), в G2=FРАСПОБР

(F2;B2;B2). Копируем заданные формулы в нижележащие ячейки способом примера 1.1. Полученные результаты приведены в табл. 1.2.

32

 

 

 

 

 

Таблица 1.2

 

 

 

 

 

 

 

 

x

ν

F(x = 1;

F(x = 3; ν; ν)

F(x = 5;

p = P{|X |>

 

xодностор

 

 

ν; ν)

 

ν; ν)

> x = 3}

 

(x = 3)

1

1

0,500000001

0,666666667

0,732279527

0,333333333

 

3

 

 

 

 

 

 

 

 

3

2

0,5

0,75

0,833333333

0,25

 

3

 

 

 

 

 

 

 

 

5

3

0,5

0,80449889

0,890448981

0,19550111

 

3

 

 

 

 

 

 

 

 

3

4

0,5

0,84375

0,925925926

0,15625

 

3

 

 

 

 

 

 

 

 

3

5

0,500000003

0,873415002

0,949030261

0,126584998

 

3

 

 

 

 

 

 

 

 

3

6

0,5

0,896484375

0,964506173

0,103515625

 

3

 

 

 

 

 

 

 

 

3

7

0,5

0,91476467

0,975066385

0,08523533

 

3

 

 

 

 

 

 

 

 

3

8

0,5

0,929443359

0,982367398

0,070556641

 

3

 

 

 

 

 

 

 

 

3

9

0,5

0,941346598

0,987464539

0,058653402

 

3

 

 

 

 

 

 

 

 

3

10

0,5

0,951072693

0,991049938

0,048927307

 

3

 

 

 

 

 

 

 

 

Для x = 1 получен нетривиальный результат – все кривые

F(x =1; ν; ν) независимо от значения ν

(ν1 = ν2 ≡ ν)

проходят

через одну точку.

Вопросы для самопроверки и защиты расчетно-графической работы № 1

1.Дайте определение основных задач математической статистики.

2.Что такое генеральная совокупность и выборка?

3.Чем различаются повторная и бесповторная выборки?

4.Что понимается под представительностью (репрезентативностью) выборки и как она обеспечивается?

5.В чем заключается цензура выборки?

6.Что называется квантилем порядка р? Каков статистический смысл порядка квантиля?

7.Дайте определение стандартного нормального распределения, перечислите, какими параметрами оно задается, сформулируйте его свойства.

33

8.Способы определения квантиля порядка р для стандартного нормального распределения.

9.Дайте определение распределения χ2 , перечислите, ка-

кими параметрами оно задается, сформулируйте его свойства.

10.Способы определения квантиля порядка р для распределения χ2 .

11.Дайте определение распределения Стьюдента, перечислите, какими параметрами оно задается, сформулируйте его свойства.

12.Способы определения квантиля порядка р для распределения Стьюдента.

13.Дайте определение распределения Фишера, перечислите, какими параметрами оно задается, сформулируйте его свойства.

14.Способы определения квантиля порядка р для распределения Фишера.

34

2. ПЕРВИЧНАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ (ДЛЯ ОДНОМЕРНОЙ ВЫБОРКИ)

Пусть в результате п независимых испытаний получены значения изучаемого признака – случайная величина Х: x1, x2 , x3 , ..., xn. Совокупность этих значений обозначают

Xn = {x1, x2 , x3 , ..., xn }, она дает статистическое распределе-

ние вероятностей случайной величины Х. Совокупность X n

называют выборкой из генеральной совокупности, характери-

зуемой одномерной случайной величиной Х с теоретическим распределением f (x), значения xi , i = 1,n, называют элемента-

ми выборки.

Если среди полученных значений есть одинаковые, то полезно собрать одинаковые значения в группы и заново перенумеровать эти группы неповторяющихся значений, располагая их в порядке возрастания. Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз,

k

х2 п2 раз, …, хk – пk раз (k n), причем nj = n, где п – объем

j=1

выборки. Тогда наблюдаемые значения случайных величин x1, x2 , x3 , ..., xk называют вариантами, а п1, п2, …, пk частота-

ми. Если разделить каждую частоту

на

объем выборки,

тополучим относительные частоты wj

= nj

/ n. Последователь-

ность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом

(табл. 2.1):

Таблица 2.1

xj

x1 = а

x2

xk = b

nj

n1

n2

nk

wj

w1

w2

wk

35

Пример 2.1. При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным

1, 1, 4, 0, 1, 2, 1, 2, 2, 0, 5, 3, 3, 1, 0, 2, 2, 3, 4, 1.

Решение. Составим вариационный ряд: 0, 1, 2, 3, 4, 5. Тогда статистический ряд для абсолютных и относительных частот имеет вид, показанный в табл. 2.2:

Таблица 2.2

xj

0

1

2

3

4

5

nj

3

6

5

3

2

1

wj

0,15

0,3

0,25

0,15

0,1

0,05

Если исследуется некоторый непрерывный признак (непрерывная случайная величина), то для нее вариационный ряд (упорядоченная последовательность элементов выборки) может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку.

Для ее получения интервал, в котором заключены все наблюдаемые значения признака R = xmax xmin = b – a (его назы-

вают размахом выборки, a < b), разбивают на несколько равных (не обязательно!) частичных интервалов (карманов, разрядов) длиной h, а затем находят для каждого частичного интервала nj – сумму частот вариант, попавших в j-й интервал. Оптимальное число частичных интервалов оценивается по формулам (с округлением до ближайшего целого)

 

k ~ 1+3,322 lg (n), k ~ n

и др.

 

Составленная по этим результатам табл. 2.3 называется

группированным статистическим рядом:

 

 

Таблица 2.3

 

 

 

 

 

 

Номера разрядов

 

1

2

 

k

Границы разрядов

 

(a, a + h)

(a + h, a + 2h)

 

(b – h, b)

Сумма частот вари-

 

n1

n2

 

nk

ант, попавших

 

 

в разряд

 

 

 

 

 

 

36

 

 

 

 

 

 

Наряду с частотами и относительными частотами рас-

сматривают также накопленные частоты и накопленные от-

k

k

носительные частоты nj , nj / n , где k – номер разряда.

j=1

j=1

В MS Excel можно создать (сгенерировать) выборки заданного объема для случайных величин с некоторыми известными законами распределения (равномерным, нормальным, биномиальным, Бернулли, Пуассона, модельным и дискретным) с помощью инструмента «Генерация случайных чисел», доступного из окна «Анализ данных». Подробный пример использования этого инструмента описан в следующем примере.

Пример 2.2. Создать 5 выборок объемом n = 10 для случайной величины X, распределенной по нормальному закону с параметрами а = 2,1, σ = 0,1 (Х~N(2.1; 0.1)).

Решение. Входим в меню Excel: «Сервис» → «Анализ данных» → «Генерация случайных чисел», задаем в соответствующих окнах информацию согласно рис. 2.1.

Рис. 2.1. Меню инструмента «Генерация случайных чисел»

37

Результаты поместим в блок А2:Е11 (рис. 2.2), подписав названия переменных в ячейках А1:Е1. Копируем таблицу срабочего листа в документ MS Word, редактируем названия переменных (столбцов) и имеем 5 выборок X10(i) в виде табл. 2.4.

Рис. 2.2. Результаты генерации 5 выборок для примера 2.2

 

 

 

 

Таблица 2.4

X10(1)

X10(2)

X10(3)

X10(4)

X10(5)

2,069976784

1,972231683

2,124425731

2,227647354

2,219835022

2,27331331

1,881641236

2,076581876

2,209502253

1,991329935

2,030979584

1,930956767

1,915308911

2,00223705

2,022649295

1,888206878

2,043207513

2,059595243

2,113485305

2,063450705

2,067300937

2,062975949

2,234264155

2,091471554

2,081384235

2,04867926

2,297221198

2,186567297

2,337565473

2,034509333

2,266145583

1,938760232

2,153894837

2,190219146

2,291891559

2,091548293

2,047620495

2,167513838

2,061867616

2,175761136

1,955581336

2,015276248

1,947842901

2,063712298

2,096752081

2,102811703

2,067728399

2,319450158

1,925751729

2,026352302

38

В полученных выборках за счет сохранения 9 знаков в мантиссах чисел нет одинаковых вариант, что является следствием их случайного выбора из гипотетической генеральной совокупности, имеющей закон распределения Х~N(2.1; 0.1).

2.1. Графический анализ выборки, полигоны и гистограммы, выборочная функция распределения

Для наглядного представления о поведении исследуемой непрерывной одномерной случайной величины в выборке, которая представляет ее статистическое распределение, можно строить различные графики.

Выборка может быть представлена графически в виде полигонов частот, относительных частот, накопленных частот, накопленных относительных частот и гистограмм частот или относительных частот, гистограмм накопленных частот или относительных накопленных частот группированной выборки.

Полигоном частот простой выборки называется ломаная линия с вершинами в точках (xj ; nj ), полигоном относи-

тельных частот – ломаная с вершинами (xj ; nj / n). Анало-

гично определяются полигоны частот и относительных частот группированной выборки, при этом в качестве первых координат берутся середины частичных интервалов (разрядов).

 

Полигоны накопленных частот и накопленных отно-

сительных

частот – ломаные с вершинами в

точках

 

k

 

 

k

 

 

xj ; nj

и xj ; nj / n соответственно. Если

выборка

 

j=1

 

j=1

 

 

группированная, то в качестве первых координат вершин берут правые границы разрядов. Получившийся при этом полигон относительных накопленных частот называют также кумуля-

тивной кривой или кумулянтой (кумулятой).

39

Гистограммой частот (относительных частот)

группированной выборки называется ступенчатая фигура, составленная из прямоугольников, основаниями которых служат частичные интервалы (разряды, карманы), а площади равны частотам (относительным частотам) этих разрядов. Отсюда следует, что площадь гистограммы частот равна объему выборки, а площадьгистограммы относительных частот – единице.

При большом объеме выборки и достаточно малой длине разряда высоты прямоугольников можно рассматривать как

приближенные значения плотности f (xj ) в средних точках

соответствующих разрядов. Таким образом, верхнюю границу гистограммы можно рассматривать как статистический аналог плотности распределения наблюдаемой случайной величины. Аналогично полигон относительных частот является статистическим аналогом теоретической плотности распределения при достаточно большом объеме выборки.

На рис. 2.1, при n = 50; h = 2, показана такая гистограмма, построенная с помощью пакета STATISTICA для выборки случайной величины Х, распределенной попоказательному закону:

f (x) =

1

exp

x

 

,

λ > 0; x 0 .

(2.1)

λ

 

 

 

 

λ

 

 

 

Рис. 2.1. Гистограмма относительных частот для выборки случайной велечины Х, распределенной по показательному закону с показателем 0,2337

40