Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

302_p306_B10_2010

.pdf
Скачиваний:
5
Добавлен:
15.04.2023
Размер:
1.29 Mб
Скачать
- частное среднее. Отсюда
i x2 =(ni 1)Si2 +(ni 1)xi2
D = Di + S2

2. Если все значения вариант умножить на одно и то же число К, то в К раз увеличится их среднее арифметическое x , отклонения от среднего арифметического x - x и среднее квадратичное отклонение S (дисперсия) увеличится в К2 раз.

3. Запишем формулу (9) в виде

(xi a)2 = S2 +(a x )2 .

N 1

Средняя величина квадратов отклонений вариант от любой величины а, больше дисперсии D. на квадрат отклонения этой величины а от среднего арифметического вариант.

4. Если совокупность разбита на несколько частей, то общая дисперсия является суммой средней величины дисперсии внутри отдельных частей совокупности Di и среднего квадрата отклонения частных средних от общей средней S 2

.

Докажем это равенство. Пусть совокупность разбита на L частей численностью в n1,n2 ,...ni и ni = n . Пусть частные дисперсии составляют

S12 , S22 ,...Si2 .

Si2 = Di = ni 11i x 2 xi2 ,

где i означает суммирование в пределах данной части совокупности, а x

.

Складывая эти суммы вместе по всем частям совокупности, получаем:

x2 = (ni 1)Si2 + (ni 1)xi2 .

Разделим все члены равенства на (n – 1)

1

2

 

ni Si2

ni xi2

 

x

=

n 1 +

n 1 .

n 1

Первое слагаемое здесь есть средняя из частных дисперсий Si2 , второе

- средний квадрат частных средних. Если вычтем из него квадрат таким же образом взвешенной их средней, то получим их средний квадрат отклонения

от этой средней, который обозначим S2 . Следовательно,

11

1

 

 

+

 

+ ni xi 2

 

x2 =

S 2

 

S 2

 

 

n 1

 

i

 

 

n 1 .

Слагаемое в скобках есть общее среднее x по всей совокупности. Следовательно,

 

1

 

x2 x 2 =

 

 

 

 

 

 

 

S 2 =

 

 

x 2 = Si

2

+

 

 

 

x2

S2

n 1

 

 

 

 

 

.

Мода

Важным показателем характеристики распределения является мода. Мода - это наиболее часто встречающееся значение варианты. Мода - это значение варианты, которой соответствует наибольшая относительная частота.

Асимметрия и эксцесс

Гистограммы распределений изучаемых статистических совокупностей довольно часто бывают асимметричными (рис.3, 4), Если среднее арифметическое лежит правее моды, то асимметрия положительная, если левее моды - отрицательная. Для статистической оценки распределения необходимо вычислять меру асимметрии, называемую коэффициентом

N i

Ni

N

N

Рис.3 . Положительная асимметрия

Рис.4. Отрицательная асимметрия

асимметрии A =

(xi x )3

вычисления. В основу коэффициента

N S3

 

 

асимметрии положено среднеквадратичное отклонение, которое даёт возможность более полно учесть крайние значения вариант. При наличии асимметрии одна сторона кривой дает большее кубическое отклонение, чем другая, и так как знак при кубическом отклонении сохраняется, то разница

12

между суммами кубических отклонений показывает положительную либо отрицательную асимметрии.

 

dN

 

 

 

Наряду

с

асимметрией

 

при

 

 

в

статистическом

 

анализе

рядов

 

Ndx

 

 

 

 

 

распределения, важное значение имеет

 

 

 

 

a

 

 

 

 

мера

эксцесса.

Мера эксцесса

-

это

 

 

 

 

 

показатель

 

отличия

данного

 

 

 

 

б

распределения

от

нормального

по

 

 

 

 

концентрации вариант около центра

 

 

 

 

 

 

 

 

 

x

распределения.

Вычисление

этого

 

 

 

 

 

 

 

 

показателя

делается для

того,

чтобы

Рис.5. Распределения с разными

определить,

 

насколько

кривая,

полученная

из

опыта,

оказывается

показателями эксцесса

более

плоской

и

растянутой,

 

или,

 

 

 

 

 

 

наоборот, более сжатой и выпуклой в центре по сравнению с кривой нормального распределения. Показатель эксцесса выражается следующей формулой:

E =

(xi x )4

N S4 .

 

Если Е ;> О , то эксцесс положительный и вершина кривой будет выше нормальной, и наоборот, если Е <, О , то эксцесс отрицательный, вершина кривой ниже нормальной (рис.5).

Статистические моменты

При вычислении среднего арифметического, дисперсии, коэффициента асимметрии и эксцесса можно пользоваться формулами:

 

 

ξ = 1

ν x

(12)

 

 

 

 

N

i i

,

ξ2

=

1

ν

(x x)2

(13)

 

 

N

i

 

i

 

,

ξ3

=

1

ν

(x x)3

(14)

 

 

N

i

 

i

 

,

ξ4

=

1

ν

(x x)4

(15)

 

 

N

i

 

i

 

.

13

Сопоставляя эти формулы, замечаем, что все они могут рассматриваться как частные случаи одной более общей формулы

 

 

Mh =

1

νi (xi x)h

(16)

 

 

 

 

 

 

N

 

 

.

При h = 1

и

x = 0 получим x .

 

 

При h = 2

и

x = х получим

ξ2

= D .

 

При h = 3

и

x = х получим

ξ3

и т. д.

 

Величина (16) называется моментом h-го порядка распределения относительно значения x .

Если в качестве X выбрано начало отсчетов, т.е. положено x =0, то момент называется начальным и обозначается mh . Если же в качестве х выбран центр распределения x , то момент называется центральным и обозначается µh . В соответствии с этой терминологией среднее значение есть начальный момент первого порядка: x = µ1 , дисперсия, или средний

квадрат отклонения S2 , есть центральный момент второго

порядка

S 2

= µ2

средний куб отклонения есть центральный момент третьего порядка

ξ3

= µ3

и т.д. Очевидно, центральный момент первого порядка всегда равен нулю:

µ1 = О.

 

 

Центральные моменты могут быть выражены через начальные

 

µ2 = m2 m12

,

(17)

µ3 = m3 3m2m1 + 2m12

,

(18)

µ4 = m4 4m3m1 +6m2m12 3m14

,

(19)

где

 

 

1

 

ni xi

 

m2 =

1

ni xi2 ,

m1

=

 

 

 

 

 

 

N

N

,

m3 =

1

ni xi3 ,

 

m4 =

1

ni xi4 .

N

 

 

N

В терминах статистических моментов коэффициент асимметрии запишется

14

 

A =

µ3

=

µ3

 

 

µ23/ 2 .

так:

 

S3

 

ТЕОРЕТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Теоретическое распределение - это математическая модель распределения вероятности по значениям дискретной случайной величины или по интервалам непрерывной случайной величины.

Вероятность

В эмпирическом распределении относительное число попаданий в

заданный интервал дается частостью vi , в теоретическом распределении

подобная величина называется вероятностью. Вероятность есть мера объективной возможности данного события. Вероятность связана с частостью появления переменной величины:

p = lim v = lim

ni

 

(21)

 

N →∞ i

N →∞ N .

 

Вероятность выражает вполне определенную, хотя и своеобразную, связь между постоянным комплексом условий и случайный событием в поле испытаний, количественно характеризуя единство необходимого и случайного. Конкретный смысл вероятности заключается в том, что она определяет среднюю частость, с которой можно ожидать появления события в длинных сериях испытаний. Значение вероятности изменяется в пределах от нуля до единицы.

Теоретическое распределение дискретной и непрерывной случайной величины

Дискретное распределение считается теоретически заданным, если известны все возможные значения x1, x2 ,..., xN , принимаемые величиной, и

вероятности p(xi ) для

каждого события в поле испытаний. Так

как эти

события должны образовывать полную группу, то полная вероятность

 

 

P = p(xi ) =1

(22)

 

 

 

i

.

 

При дискретном

распределении

общая масса вероятности,

равная

единице, сосредоточена в счетной или конечной системе точек хi . Другими

15

словами, точечное распределение массы вероятности, подобно, например, точечному распределению электрических зарядов. К теоретическим распределениям дискретных величин относятся биномиальное, гипергеометрическое, распределение Пуассона. Каждое из этих распределений описывается аналитической функцией, выражающей зависимость вероятности от дискретной переменной величины и параметров распределения.

Функция биноминального распределения:

P (x) =

n!

pxqnx

(23)

 

 

n

x!(n x)!

 

 

 

,

 

 

 

 

где q = 1 – p, n, p - параметры распределения. Функция распределения Пуассона

P (x) =

eλλx

(24)

n

x!

,

 

где λ - параметр распределения.

Для теоретического изучения распределения непрерывных величин вводится понятие плотности вероятности ρ(x)

ρ(x) =

P(x < X < x + ∆x)

 

 

 

 

x

 

,

где x длина малого интервала, начинающегося в точке x

Для бесконечно малого интервала x вероятность

p(x < X < x + ∆x) = ρ(x) x

,

(25)

 

 

 

для конечного интервала (x1 , x2 ) , где x1 < x2 ,

 

x2

 

 

P(x1 < X < x2 ) = ρ(x)dx

 

x1

 

.

Интеграл от плотности вероятности распределения по любому

промежутку оси дает вероятность попадания величины X в этот промежуток

x.

Плотностью распределения может служить любая интегрируемая

функция ρ(x) , удовлетворяющая двум условиям:

 

1. ρ(x) 0 ,

(26)

16

ρ(x)

2.

+∞ρ(x)dx =1.

 

(27)

 

−∞

 

 

Вероятность

 

 

 

 

P( X < x) = x

ρ(x)dx = P(x)

(28)

 

−∞

 

 

называется интегральной функцией распределения в отличие от плотности вероятности , которую называют дифференциальной функцией распределения.

Графическое представление дифференциальной функции распределения

ρ(x)

На

графике (рис.6) плотность вероятности

ρ(x) является ординатой кривой распределения, а

 

ρ(x)

вероятность Р(х) равна площади под этой кривой oт −∞

до x . По определению Р(Х) обладает следующими

 

P(x)

свойствами:

 

x

I. P(x)- непрерывная возрастающая функция: её

приращение в промежутке (x1 , x2 ) равно вероятности

Рис.6. Плотность

для величины X попасть в этот промежуток. В самом

деле, по правилу сложения вероятностей:

вероятности

 

 

 

P(X < x2 ) = P(X < x1 ) + P(x1 X < x2 ) ,

т.е. P(x2 ) = P(x1 ) + P(x1 X x2 ) ,

и следовательно

x2

P(x1 < X < x2 ) = P(x2 ) p(x1 ) = ρ(x)dx .

x1

2. xlim→−∞ P(x) = 0 ,

(29)

lim P(x) =1.

(30)

x→+∞

 

17

3. Производная от интегральной функции распределенная P(x) равна плотности ρ(x) , т.е

dP(x)

= ρ(x)

(31)

P (x) =

dx

 

 

.

ПАРАМЕТРЫ ТЕОРЕТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ

Математическое ожидание

Среднее арифметическое, являющееся центром эмпирического

распределения, переходит в математическое ожидание Mx при N → ∞. В теоретическом распределении дискретных величин математическое ожидание

 

 

Mx = Nlim→∞

xi p(xi )

(32)

 

i=1

.

Математическое ожидание непрерывно распределенной величины

Mx = +∞xρ(x)dx

(33)

−∞

.

При многократных экспериментальных определениях некоторой величины в одних и тех же условиях (при отсутствии систематических погрешностей) математическое ожидание можно рассматривать как "истинное" значение этой величины.

Дисперсия

В теоретическом распределении дисперсия σ 2 есть математическое ожидание квадрата отклонений случайной величины от её математического ожидания

σ 2 = M (x Mx)2

.

(34)

 

 

Если обозначить Mx = a , то дисперсия распределения дискретной величины может быть записана:

σ 2 = (xi a)2 pi .

(35)

в случае непрерывной величины:

 

18

σ 2 = +∞(x a)2 ρ(x)x

(36)

−∞

.

Нормальное распределение

Происхождение каждого эмпирического распределения обусловлено какими-то определенными естественными причинами. Совокупность причин, приводящих к тому или иному распределению, может быть в каждом случае иной.

Теоретическое распределение случайной величины, которому чаще всего соответствуют эмпирические распределения случайных величин в природе, является нормальным распределением или распределением Гаусса (закон Гаусса). Плотность вероятности нормального распределения определяется равенством:

 

 

 

 

(xi

x)

2

 

 

f (x)= ρ (x)=

1

e

 

ˆ

 

 

 

 

,

(37)

 

 

2σ2

 

 

 

 

 

 

 

2πσ

для любого значения

ρ(x)

− ∞ x +∞ , где xˆ - математическое ожидание, σ 2 - дисперсия, xˆ и σ 2 -параметры распределения.

Соответствующая этой плотности дифференциальная кривая распределения показана на рис.7.

Интегральная функция нормального распределения записывается в виде:

 

x

 

F(x)= x

f (x)x

 

(38)

Рис.7. Дифференциальная кривая

 

 

−∞

.

 

распределения

 

 

 

 

 

 

График

интегральной

функции

 

 

распределения изображен на рис.8.

Полная площадь под всей кривой выразится интегралом

 

 

 

F(− ∞;+∞)=

1

+∞

(xx )2

 

 

 

 

e

2σ 2

x

 

(39)

 

 

2πσ

−∞

 

.

 

 

 

 

 

 

 

 

 

Значение интеграла (39) равно единице.

19

Рис.9. Функция нормального распределения

F(x)

 

 

 

 

 

 

Свойства нормального

 

 

 

 

 

 

 

 

 

 

 

распределения

 

 

 

 

 

 

 

 

 

 

 

1. Из рис.9 видно, что

 

 

 

 

 

 

 

нормальное

 

 

 

распределение

 

 

 

 

 

 

 

симметрично

относительно

ординаты,

 

 

 

 

 

 

 

соответствующей

 

 

значению

ˆ

 

 

 

 

 

 

 

 

 

x .

 

 

 

 

 

 

 

Значение

 

ˆ

является

центром

 

 

 

 

 

x

 

 

x

 

 

xσ x x+σ

 

группирования

-

 

математическим

Рис. 8. Интегральная функция

 

ожиданием распределения.

 

 

 

Наибольшая ордината, отвечающая

 

распределения

 

 

 

 

значению

x

= ˆ

 

 

 

 

 

 

 

 

 

 

 

 

x , имеет величину:

 

 

 

 

 

 

ˆ

=

1

 

 

 

 

 

 

(40)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x)

 

2πσ .

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

но различных

σ

получим семейство

 

2. При одном и том же значении x ,

 

ρ(x)

σ1

 

 

кривых (рис. 9).

 

 

 

 

 

 

σ

 

 

 

 

Из

рис.

9

видно,

что

когда

 

 

 

σ21

уменьшается,

ордината

 

растет.

Подъем

 

 

 

 

 

кривой в центральной части компенсируется

 

 

 

 

σ32

более резким спадом её к

оси x , так

что

 

 

 

 

общая

площадь

остается

неизменной

и

 

 

 

 

 

равной I.

 

 

 

 

 

 

 

 

 

 

 

x

 

 

Нормальная

кривая имеет

две точки

 

 

xˆ

 

 

 

 

 

 

 

перегиба, абсциссами которых являются σ .

Следовательно, чем больше σ , тем шире кривая.

3. Интеграл от плотности вероятности нормального распределения в пределах от σ до +σ равен 0,683; в пределах от 2σ до +2σ - 0,955; от 3σ

до +3σ - 0,997.

4.Коэффициент асимметрии Α нормального распределения равен нулю.

5.Эксцесс нормального распределения равен нулю.

Выборки

Статистическая совокупность, свойства которой необходимо изучать, называется генеральной совокупностью. Статистической экспериментальной

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]