Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8965

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.07 Mб
Скачать
~ 2 , где
D( X ) M ( X )

Вычисляя вероятность попадания случайной величины в интервал длиной h , получим, что Ph P(x X x h) F(x h) F(x) h /(b a) , то есть эта вероятность постоянна и не зависит от расположения h интервала в областиX , а зависит лишь от длины интервала. Такая величина, принимающая свои значения с равной вероятностью во всех точках области возможных значений, называется равномерной случайной величиной. Обратная функция распределения и квантили для такого распределения следующие:

Fî áð ( p) a p(b a) , xβ Fî áð (β) , xα Fî áð (1 α) .

1.2.Числовые характеристики случайных величин

Закон распределения случайной величины, заданный в той или иной форме, полностью определяет случайную величину как некоторую модель наблюдаемого в опыте явления. Однако часто в практической деятельности знание закона бывает невозможным, а то и избыточным, достаточно знать лишь некоторые общие (интегральные) характеристики случайной величины.

Пусть случайная величина X , дискретная или непрерывная, задается законом распределения, тогда основными характеристиками случайной величины являются:

Математическое ожидание:

 

 

xk

pk

для

дискретной

случайной

величины

 

 

k

 

 

 

 

 

M ( X ) mX

 

xf X (x)dx

для

непрерывной

случайной

величины

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

Дисперсия:

 

 

(xk

mX )2

pk

для

дискретной случайной величины

 

 

m

 

 

 

 

D( X ) DX

 

(x mX )2 f X

(x)dx

для

непрерывной случайной величины

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

Среднеквадратическое отклонение:

ζ( X ) ζX

DX .

Математическое ожидание М (X ) mX

характеризует центр распределе-

ния или средневзвешенное ожидаемое значение величины, а геометрически оно изображается как координата центра тяжести фигуры, образованной осью х и линией функции f (х) или p(хm ) . Дисперсия D( X ) 2x характери-

зует средний ожидаемый разброс (широту, изменчивость, вариативность) значений величины возле М ( X ) , поскольку совпадает с математическим ожиданием квадрата отклонения случайной величины от его математическо-

го ожидания.

~ .

X X mX

Среднеквадратическое отклонение ( X ) x имеет тот же смысл, что и дисперсия, но в отличие от неѐ имеет размерность, совпадающую с размерно-

10

стью самой случайной величины, что более удобно и позволяет изобразить его как и математическое ожидание на рис. 1.6. Между дисперсией и математическим ожиданием имеется простая связь D(X ) M (X 2 ) M 2 (X ) .

Рис. 1.6. Геометрическая иллюстрация понятий математического ожидания М ( X ) mX и дисперсии D( X ) 2x случайной величины

Пример. Рассмотрим случайную величину X , определенную на множестве возможных значений Х {[0; )} со следующим законом распределе-

ния F (x) 1 e λx ,

f

X

(x) λ e λx ,

где параметр λ 0 . Такая случайная непре-

X

 

 

 

рывная величина называется показательной (рис. 1.7).

Рис. 1.7. Функция распределения FX (x) и плотность распределения f X (x) показательной случайной величины

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M ( X ) x e x dx x e x

 

0 e x dx 0 1 e x

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M ( X 2 ) x2 e x dx x2 e x

 

 

 

 

 

 

x e xdx

0

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

2

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

2

1

2

1

 

 

 

 

 

 

 

 

 

 

D( X ) M ( X

 

) M

 

( X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Математическое ожидание постоянной величины равно этой постоянной величине, а еѐ дисперсия равна нулю:

X C const M (X ) C , D( X ) 0 .

Умножение случайной величины на постоянный множитель приводит к следующему изменению еѐ характеристик:

11

M (C X ) C M (X ) , D(С X ) С 2 D(X ) , где C const.

Математическое ожидание суммы конечного числа случайных величин равно сумме математических ожиданий этих величин:

M (X1 X2 Xk ) M (X1) M (X2 ) M (Xk ) .

Из вышеприведѐнных свойств можно заметить, что при преобразовании случайной величины X по линейному закону в величинуY

Y

X mX

M (Y ) 0,

D(Y ) 1.

ζX

 

 

 

Такое преобразование случайной величины называется центрированием и нормированием, а характеристики получаемой величины называются стандартными.

Для независимых случайных величин X и Y имеет место:

D(X Y ) D(X ) D(Y ) ,

M (XY ) M (X ) M (Y ) .

Величины называются независимыми, если распределение любой из них не зависит от того, какие значения принимает другая величина. В противном случае величины являются статистически зависимыми.

1.3. Нормальная случайная величина

Случайная величина имеет нормальный закон распределения (закон

Гаусса), если она определена в области Х

{( ; )}, а еѐ плотность рас-

пределения вероятностей имеет вид:

 

 

1

 

( x m)2

 

f (x)

 

 

 

 

2

Í Î ÐÌ

.ÐÀÑÏ (x, m, ζ, 0)

 

 

 

ζ 2 e

 

 

 

 

 

где m и - параметры распределения ( ζ 0, m ).

Нормальный закон распределения X N(m, ζ) наиболее часто встречается на практике. Главная его особенность – он является предельным законом, которым приближаются другие, более сложные законы распределения [7].

Плотность вероятности f (x) похожа на «колокол» (рис. 1.8).

При уменьшении только параметра , график функции сжимается и поднимается вверх по оси ординат. При изменении только параметра m , график перемещается вдоль оси абсцисс.

Рис. 1.8. Функция плотности распределения нормальной величины

12

Функция распределения F (x) нормальной величины имеет вид:

x

 

 

 

 

 

1

 

 

x

 

(t m)2

 

1

 

x m

 

 

F (x) f (t) dt

 

 

 

 

 

e

2

dt

Ô(

) Í Î ÐÌ .ÐÀÑÏ (x, m, ζ,1)

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

ζ

ζ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

x

u 2

 

 

 

 

 

 

 

 

 

где (x)

 

 

e

 

 

 

- функция Лапласа. График функции распределения

 

 

2 du

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

F (x) изображен на рис. 1.9.

Рис. 1.9. Функция распределения нормальной величины

Вероятность того, что изучаемая случайная величина (распределѐнная нормально) примет значение в пределах от x1 до x2 вычисляется по обычной формуле:

 

 

 

x m

 

x2

m

 

x1

m

 

 

 

 

 

 

 

P(x X x

) Ô(

)

Ô(

x2

) Ô(

) .

 

 

 

 

 

1

2

 

ζ

 

 

ζ

ζ

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

В частном случае, когда интервал симметричен относительно точки m , эта формула выглядит так:

 

 

 

 

 

ε

 

 

 

P(m ε X m ε)

P(

X m

 

ε) 2

 

.

 

 

 

 

 

 

 

ζ

 

 

 

Рассмотрим вероятность того, что изучаемая случайная величина (распределѐнная нормально) примет значение в пределах от m до m :

P(m X m 3ζ) 2(3ζ/ζ) 2 (3) 0,9973 ,

т.е. вероятность значений изучаемой случайной величины именно на интервале [m 3ζ, m 3ζ] велика. Это утверждение составляет правило «трѐх сигм». Числовые характеристики нормальной случайной величины будут:

М ( X ) m , D( X ) ζ2 .

Пример. Наблюдение за скоростью автомашин на определѐнном участке дороги показало, что скорость есть нормальная случайная величина с математическим ожиданием 60 км/ч и среднеквадратическим отклонением

10км/ч. Определить вероятность того, что:

-скорость на этом участке не превышает 80 км/ч,

-скорость не отклоняется от математического ожидания более чем на

20%.

Поскольку скорость есть нормальная величина с параметрами m 60 и ζ 10 , то по основным формулам находим:

13

P(0 V 80)

Ô(

x m

)

 

80

Ô(

80 60

) Ô(

0 60

) Ô(2) Ô( 6) 0, 477 0,5 0,947 ,

 

 

 

 

 

 

 

 

 

 

ζ

 

0

 

 

 

10

 

 

 

10

 

 

 

20% î ò

60 12

 

P(

 

V 60

 

12) 2 (

12

) 2Ô(1, 2) 2 0,385 0, 770 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим скорость, которую автомашины на этом участке не превышают с вероятностью 0,99. Из уравнения

P(0 V vmax ) Ô( x m)

 

vmax

Ô(vmax 60) Ô(0 60) Ô( vmax 60) Ô( 6) 0,99 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ζ

 

0

10

 

10

10

 

 

vmax 60

 

 

 

 

vmax 60

 

 

 

60 10 2,33 83,3 .

Ô(

) 0, 49

 

2,33 vmax

 

 

10

 

 

 

 

 

10

 

 

 

 

 

 

1.4. Системы случайных величин

Если рассматривается система случайных величин X ,Y , Z,.., то между ними могут быть следующие взаимные соотношения:

-они могут быть независимыми, когда распределение каждой из них не зависит от того, какие значения примут другие величины. Например, X - температура воды на входе системы отопления жилого многоквартирного дома, а Y - количество жильцов, проживающих в доме, эти величины независимы;

-они могут быть зависимы функционально, когда между значениями величин имеется функциональная связь вида Y=φ(X). Так, площадь выражается через измерения случайных размеров. Связь между распределениями величин устанавливается достаточно просто при взаимно однозначной функциональной связи [4]:

FY ( y) FX (ψ( y)) , fY ( y) ψ ( y) fX (ψ( y)) ,

где ψ( y) обратная для φ(x) функция. Например, для равномерной X и Y X 2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X Rn(a,b),

b a 0 , ψ( y)

 

 

 

y a

,

 

 

( y)

 

1

 

 

 

1

;

y , F ( y)

f

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

b a

 

2

 

y

b a

 

 

 

 

 

 

 

- случайные величины могут быть зависимыми статистически, когда распределение каждой случайной величины зависит от того, какие значения принимают другие величины. Например, X -температура воды на входе системы отопления жилого многоквартирного дома, а Y - количество жильцов, обратившихся с жалобой в ДУК на холод в квартирах , эти величины зависимы статистически.

Такая зависимость полностью может быть описана условными распределениями величин. Так, для пары величин X ,Y условное распределение задаѐтся функцией двух переменных fX (x y) или fY ( y x) , представляющих со-

бой распределения одной величины при заданном значении другой величины. Распределения самих величин связаны с условными распределениями следующим образом:

fX (x) fX (x

 

y)dy ,

fY ( y)

fY ( y

 

x)dx ,

 

 

 

 

Y

 

X

14

причем, оказывается, что fX (x) fY ( y x) fY ( y) fX (x y) f (x, y) , а f (x, y) называется функцией совместного распределения и она связана с вероятностью значений величин через функцию совместного распределения

F(x, y) P( X x,Y y)

f (x, y)dxdy .

 

X x,Y y

Часто рассматриваются условные математические ожидания величин

 

 

 

 

 

 

 

 

 

 

Y

(x) MY (x) y f y ( y

 

x)dy ,

X ( y) M X ( y) x fx (x

 

y)dx ,

 

 

 

 

 

 

Y

 

 

x

такая зависимость средних значений (математических ожиданий) от значения других переменных называется регрессией. Функция регрессии g(x) Y (x) и условные распределения иллюстрируются на рисунке 1.10.

Рис. 1.10. Функция регрессии для зависимых величин

В случае независимости величин условные распределения совпадают и

fY ( y

 

x) fY ( y),

fX (x

 

y) fX (x) , а f (x, y) fX (x) fY ( y) , M (x y) M (x) M ( y) .

 

 

В случае статистической зависимости введѐм понятие ковариационного момента (ковариации):

Cov(X ,Y ) M (X Y ) M (X ) M (Y ) ,

который показывает степень статистической зависимости величин X и Y , поскольку при независимости переменных он равен нулю, а для статистически зависимых величин справедливы следующие формулы:

M (X Y ) M (X ) M (Y ) Cov(X ,Y ) ,

 

D(X Y ) D(X ) D(Y ) 2Cov(X ,Y ) .

Введем также безразмерную величину коэффициента корреляции

ρXY

 

 

Cov( X ,Y )

 

,

 

 

 

 

 

 

 

 

 

 

 

D( X ) D(Y )

 

 

 

 

 

 

 

обладающего следующими свойствами:

 

 

 

 

 

- его значение по модулю не превышает единицы 1 ХУ

1.

- для независимых величин X и Y

ХУ 0 ,

 

- для линейно зависимых величин

 

ХУ 1 .

 

Это позволяет использовать коэффициент корреляции в качестве меры статистической зависимости случайных величин. Говорят, что величины коррелируют между собой, если коэффициент корреляции не равен нулю.

15

2. Основные задачи и методы математической статистики

Для установления закономерностей, которым подчинены случайные события и случайные величины, теория вероятности, как и любая другая наука, обращается к опыту – наблюдениям, измерениям, экспериментам. Результаты наблюдений за случайными величинами объединяются в наборы статистических данных. Задачей математической статистики, раздела современной теории вероятностей, является разработка методов сбора и обработки статистических данных, а также их анализа с целью установления законов распределения наблюдаемых случайных величин [2].

2.1. Выборочный метод

Генеральной совокупностью является набор всех мыслимых статистических данных, при наблюдениях случайной величины:

хГ {х1 , х2 , х3 ,......, хN } {xi ; i 1, N} .

Наблюдаемая случайная величина Х называется признаком или фактором выборки. Генеральная совокупность есть статистический аналог случайной величины, еѐ объем N обычно велик, поэтому из неѐ выбирается часть данных, называемая выборочной совокупностью или просто выборкой

хB {х1 , х2 , х3 ,......, хn } {xi ; i 1, n} ,

хВ хГ , n N .

Использование выборки для построения закономерностей, которым подчинена наблюдаемая случайная величина, позволяет избежать еѐ сплошного (массового) наблюдения, что часто бывает ресурсоѐмким процессом, а то и просто невозможным. Однако выборка должна удовлетворять следующим основным требованиям:

- выборка должна быть представительной, т.е. сохранять в себе пропорции генеральной совокупности,

-объѐм выборки должен быть небольшим, но достаточным для того, чтобы полученные результаты еѐ анализа обладали необходимой степенью надѐжности,

-данные в выборке не должны бать «засорены» грубыми измерениями, содержащими нетипично большие ошибки измерений.

Отметим, что в более строгом смысле выборку можно представить как

случайную многомерную величину Х B {Х1 , Х 2 , Х 3 ,......, Х n } {Х i ; i 1, n} , у которой все компоненты Х i распределены одинаково и по закону распределения наблюдаемой случайной величины. В этом смысле выборочные значения хB есть одна из реализаций величины Х В .

Возможные значения элементов выборки хB {xi ; i 1, n}, называются вариантами x j выборки, причѐм число вариант m меньше, чем объѐм выбор-

16

ки n . Варианта может повторяться в выборке несколько раз, число повторения варианты x j в выборке называется частотой варианты n j . Причѐм,

n1 n2 ..... nm n . Величина wj nj / n называется относительной частотой варианты x j .

Упорядоченный по возрастанию значений набор вариант совместно с соответствующими им частотами называется вариационно-частотным рядом выборки:

Vxn {x j , n j ; j 1, m} ; Vxw {x j , j ; j 1, m}.

Ломаная линия, соединяющая точки вариационно-частотного ряда на плоскости (x, n) или (x, ) называется полигоном частот. Вариационно-частотный ряд имеет существенный недостаток, а именно, ненаглядность полигона в случае малой повторяемости вариант, например, при наблюдении непрерывного признака его повторяемость в выборке маловеро-

ятна. Более

общей

формой описания элементов выборки является гисто-

грамма выборки.

 

 

Для

построения гистограммы разобьѐм интервал значений выборки

R xmax

xmin на m интервалов h j (x j , x j 1 )

длины h R / m с границами

x j xmin

h ( j 1) .

Число элементов выборки

хB , попадающих в интервал,

h j называется частотой n j интервала, кроме того вводятся следующие величины:

j nj / n ~ относительная частота интервала,

w j j / h j ~ плотность относительной частоты интервала.

Совокупность интервалов, наблюдаемой в выборке случайной величины и соответствующих им частот, называется гистограммой выборки. Различаются гистограммы частот, относительных частот и плотности частоты и обозначаются соответственно:

H xn {h j , n j ; j 1, m}, H x {h j , j ; j 1, m}, Hxw {hj , wj ; j 1, m} .

Для частот гистограммы выполнены следующие условия нормировки:

m

m

m

n j n ,

j 1 ,

w j h 1

j 1

j 1

j 1

Число интервалов гистограммы m должно быть оптимальным, чтобы, с одной стороны, была достаточной повторяемость интервалов, а с другой стороны не должны сглаживаться особенности выборочной статистики. Рекомендуется значение m 1 3,2 lg( n) . На плоскости (x, n) гистограмма представляется ступенчатой фигурой.

17

Помимо полигона и гистограммы выборка характеризуется следующи-

ми основными числовыми характеристиками:

 

1

 

 

n

 

 

 

 

 

 

 

хВ

xi

 

 

 

~

выборочное среднее;

 

 

 

 

 

 

 

n

i 1

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

DВ

(xi

xB )2

 

~

выборочная дисперсия;

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

В

 

 

 

 

 

DB

 

 

 

 

 

~ выборочное среднеквадратическое отклонение;

 

1

 

 

 

n

 

 

 

 

 

S 2

 

 

(xi

xB ) 2

~

исправленная выборочная дисперсия;

 

 

 

 

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

S

 

 

S 2

 

 

 

 

 

~ исправленное выборочное среднеквадратическое

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отклонение (выборочный стандарт).

Пусть, например, дана выборка полуденных температур месяца Май своим вариационно-частотным рядом с объѐмом n 31 .

хj

0

2

3

7

8

12

14

16

19

23

25

27

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nj

2

1

1

2

3

4

2

3

6

2

1

3

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полигон и гистограмма данной выборки приводятся ниже на рис.2.1.

Рис. 2.1. Полигон и гистограмма частот выборки

Расчѐт основных выборочных характеристик может быть легко проведен с помощью статистических функций приложения Excel-13 :

18

 

1

 

 

n

 

 

 

õÂ

xi

ÑÐÇÍ À× (x B ) 14,87 ;

 

 

 

 

n i 1

 

 

 

 

1

 

n

 

 

 

DÂ

(xi xB )2 ÄÈÑÏ .Ã(õÂ ) 60,31 ;

 

 

 

 

 

 

n i 1

 

 

 

ζÂ

 

 

 

 

 

 

ÑÒÀÍ ÄÎ ÒÊËÎ Í .Ã(õÂ ) 7.77 ;

 

DB

 

 

S 2

 

 

 

 

n

DB ÄÈ ÑÏ .Â(õÂ ) 62.32 ;

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

S

 

 

S 2 ÑÒÀÍ ÄÎ ÒÊËÎ Í .Â(õ ) 7.89 .

 

 

 

 

 

 

 

 

 

 

 

Â

Отметим, что все числовые характеристики выборки являются случайными величинами, поскольку получены по случайно взятой выборке. На элементах другой выборки наблюдений над той же случайной величиной Х числовые характеристики в общем случае изменят свое значение.

Рассмотрим выборочные распределения нормальных выборок. Если наблюдаемая случайная величина Х является нормальной, т.е Õ N(m, ζ) , где m - математическое ожидание, - среднеквадратическое отклонение, то случай-

 

 

 

 

 

 

1

n

 

ная величина среднего выборочного

 

 

 

Х i

так же является нормальной

Х

В

n

 

 

 

 

 

 

i 1

 

ÕÂ N(m, ζ /

 

) . Здесь Õi N(m, ζ) нормальные случайные величины, совпа-

n

дающие с наблюдаемой величиной. Рассмотрим стандартные нормальные величины ξ N(0;1) в виде:

0

 

Х

В a

,

i

 

Х i a

 

 

 

 

 

/ n

 

 

 

 

 

и построим из них случайные величины Пирсона 2n и Стьюдента t n [4,8]:

 

 

 

n

 

 

 

1

n

 

 

 

 

 

 

nDВ

 

n 1

 

 

2

 

 

 

2

 

 

( X

 

a)2

 

S 2

,

 

2

 

2

2

n 1

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tn 1

 

 

 

 

0

 

 

 

 

 

X B

a

 

 

 

 

X B a

.

 

 

 

 

 

 

 

 

 

B /

 

 

 

 

 

 

 

 

 

 

 

 

 

n2 /(n 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

S / n

 

 

Отсюда видно, что случайная величина выборочной дисперсии DВ распределена пропорционально «Хи-квадрат» случайной величине с n-1 степенью свободы, а отклонение выборочного среднего от математического ожидания распределено пропорционально t-величине Стьюдента с n-1 степенью свободы. При сравнении двух выборок объѐмов n1 и n2 часто используется случайная величина Фишера [8] со степенями свободы n1 и n2 :

 

2

/ n

Fn1 ,n2

n

1

 

1

 

.

2

/ n

 

n

2

 

 

2

 

 

Распределения этих величин, как функций от стандартных нормальных величин, хорошо изучены и построены их функции распределения, обратного

19

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]