Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы анализа и обработки наблюдений

..pdf
Скачиваний:
12
Добавлен:
15.11.2022
Размер:
10.29 Mб
Скачать

2.3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ

51

по наблюдениям определяется, как правило, лишь общая дисперсия всех изучаемых факторов. Если факторы неза­ висимы, общая дисперсия есть просто сумма дисперсий, связанных с каждым фактором по отдельности. Убрав один фактор (а это обычно можно сделать), мы сразу же увидим, насколько изменилась общая дисперсия; разность как раз и даст нам дисперсию убранного фактора, которую в чистом виде выделить было невозможно. Эта идея лежит в основе дисперсионного анализа, изучаемого ниже, в § 8.

По сравнению со значениями случайной величины дис­ персия измеряется в квадратных единицах. Для того чтобы иметь меру рассеяния, сопоставимую со значениями, часто рассматривают корень квадратный из дисперсии, который называют средним квадратичным отклонением случайной величины.

§3. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

3.1.Пример нормального распределения (задача о рас­ сеянии снарядов). Мы уже неоднократно отмечали, что боль­ шинство результатов, получаемых при наблюдениях, яв­ ляются случайными величинами. Для того чтобы иметь воз­ можность обрабатывать такие результаты, а тем более делать дальнейшие прогнозы, необходимо знать распределения соответствующих случайных величин.

Число всевозможных типов распределений, разумеется, неограничено. Однако на практике далеко не все распреде­ ления встречаются одинаково часто. Анализ различных слу­ чайных величин, как изучаемых теоретически, так и вы­ числяемых на основании опытов, показывает существование одного наиболее часто встречающегося распределения, на­ зываемого нормальным.

Совокупность свойств случайной величины, по которым можно найти ее распределение, назовем определяющими свойствами. Эти свойства обычно проверяются намного легче, чем непосредственно само распределение. Теоремы, устанавливающие, какие свойства определяют то или иное распределение, составляют важный раздел теории вероятно­ стей. Оказывается, что многие весьма простые и часто встре­ чающиеся свойства случайных величин определяют именно нормальное распределение.

Приведем пример свойств, определяющих нормальное распределение; по этому примеру можно будет судить, на­ сколько распространенными бывают такие свойства. Пусть координаты случайной точки на плоскости являются неза­ висимыми случайными величинами, т. е. имеют совершенно самостоятельные и независимые друг от друга функции рас­ пределения. Эту же точку можно рассматривать в какойлибо другой системе координат. Новые координаты снова будут случайными величинами, но они уже могут не быто

3.1. ПРИМЕР НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

53

независимыми. Оказывается, достаточно, чтобы существо­ вала еще одна система с тем же началом координат, в кото­ рой обе координаты случайной точки независимы — и расп­ ределение любой из упомянутых координат уже не может быть никаким другим, кроме нормального.

Доказательство сформулированного утверждения слиш­ ком сложно. Мы рассмотрим более частный случай, когда случайная точка имеет одинако­ вое распределение вдоль любой оси, проходящей через заданное начало координат. В этом слу­ чае все системы координат рав­ ноправны, поэтому в любой из них координаты независимы и имеют одну и ту же функцию распределения. Для такого рас­ пределения имеется хорошая фи­ зическая интерпретация — рас­

сеяние

снарядов при

стрельбе

из артиллерийского орудия. Дей­

ствительно, все основные несим­

метричные факторы,

действую­

щие на

снаряд (ветер,

сила тяжести и т. п.), учитываются

при наводке орудия. Остальные же факторы, являющиеся случайными и вызывающие рассеяние снарядов, действуют во всех направлениях с равной вероятностью. К этим фак­ торам относятся, например, колебания воздуха, неодинако­ вость снарядов. Если точку наводки принять за начало координат, а точки попадания снарядов считать случайными, то распределение таких точек как раз и будет удовлетво­ рять всем необходимым условиям (примерная картина попа­ даний дана на рис. 10).

Итак, мы воспользуемся примером рассеяния снарядов, чтобы вывести основные формулы нормального распределе­ ния. Рассмотрим на плоскости некоторую точку М (х, у) и какую-либо площадку вокруг нее. Если площадка неве­ лика, то вероятность попадания в нее приближенно (с точ­ ностью до бесконечно малых более высокого порядка) пропорциональна площади As этой площадки. Следователь­ но, для различных площадок, окружающих точку М и имею­ щих одинаковую площадь As, вероятности попадания

54 §3. НОРМАЛЬНОЕ РАСПР ЕДЕ ЛЕНИ Е

«почти» равны

они могут отличаться лишь на такую вели-

чину а, что

 

 

 

 

lim f- = 0.

 

 

A s - * o A S

Возьмем теперь

в качестве площадки прямоугольник

с центром в точке

М и сторонами, параллельными осям

координат (рис. 11). Вероятность попадания в такой прямо­

У;

 

 

угольник

обозначим че­

 

 

рез Р.

Это

попадание

 

 

 

можно

рассматривать

 

 

М(л,у)

как совместное осущест­

 

1

вление двух

событий:

 

 

 

 

попадание в вертикаль­

 

1

 

 

 

ную полосу шириной Ах

 

1

 

 

 

(см. рис.

11) и попадание

 

1

 

У о

А ъ

 

X в горизонтальную поло­

 

 

су шириной Ау. В силу

 

Рис. 11.

 

 

 

независимости

коорди­

 

 

 

нат оба эти события не­

зависимы, поэтому, найдя их вероятности и перемножив, мы и получим Р.

Попадание снаряда в вертикальную полосу равносильно

тому,

что

абсцисса

точки

попадания

окажется в отрезке

х —у

Ах,

x-f-yA x

;

вероятность такого события есть

 

 

 

х +

1

А.х

 

 

 

 

 

2

 

 

 

 

Р (Ах) =

 

^

/ (x)dx «

/ (х) Ах,

*-----1 Ах.

где f (х) — плотность распределения координаты х. У коор­ динаты у должно быть то же самое распределение, поэтому вероятность попадания в горизонтальную полосу равна

 

и+ —

А у

р (Ьу) =

5

/ (у) dy ~ f (у) Ьу.

1.

у— — А у

Оба равенства здесь приближенные, но погрешности при этом имеют более высокий порядок малости, чем Ах и Ау.

3.1. ПРИМЕР НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

55

Таким образом, вероятность попадания в прямоуголь­

ник будет

 

Р = Р (Ах) Р (Ау) « / ( * ) / (у) As,

 

где As=Ax Ау есть площадь прямоугольника.

для

Все проведенные рассуждения можно повторить

любой другой системы ОххУх- Вероятность попадания в но­ вый прямоугольник будет равна

P i ~ f (*i) / Ы А&Т.

где х 1у ух — новые координаты точки М, a Asx — площадь нового прямоугольника. Если площади As и Asx выбрать одинаковыми, то, как уже указывалось выше,

f (х) f (у) As = / (Xi) / (i/х) Asx+a

(в добавку а мы включили и все прочие погрешности, по­ этому равенство стало точным). Деля обе части этого ра­ венства на As=As1, получим:

/ (х) / (У) = / (Хх) / (Ух) т £ •

Устремляя теперь As к нулю и учитывая, что ^ при этом

также стремится к нулю, придем к основному равенству

f (х) f (У) =--■f М f (ух).

Если выбрать новые оси координат так, чтобы ось Ох± проходила через точку М, то новые координаты выразятся через старые формулами:

x1 = Vrx2+ y2, ух = 0.

В этом случае для функции получится соотношение

f (х) f (у) = f (Vx* + у2) f (0).

Введем обозначения

и = У х 2 + у2, k = f( 0),

тогда

f{x)f(y) = kf(u).

От этого равенства можно перейти к некоторому диффе­ ренциальному уравнению, позволяющему найти функцию

56

§3. НОРМАЛЬНОЕ Р АС ПР Е ДЕ Л ЕН И Е

/ в явном виде. Для этого продифференцируем обе его час­ ти по х :

df (*)

f(y) = k

df (и)

- k

df(и)du

dx

dx

du dx

Аналогично, дифференцируя обе части по у , получим

/(*)

df (у)

и df (и)

и df (и) du

dy

к dy ~ к du dy

Из обоих равенств

можно найти

h df(u)

 

 

 

du

k.

du -

 

Но

du

 

 

X

 

dx

V~X2-{-y2

Поэтому

.\df(x) V x2 + y2

1

dx

x

du

f (Y\df{y).du

' dx ~~1 w

dy ' dy '

<■§1

II

Vx2 + y2

дУ

 

f (Y\df{y)

V x2 + y2

' 1

' dy

у

Отсюда уже нетрудно получить равенство

1

df(x)

1

df (у)

xf (х)

dx

yf {у)

dy

В полученном равенстве левая часть не зависит от у , правая часть не зависит от х. Но поскольку они все-таки равны друг другу, то значит, они обе не зависят ни от х, ни от у , т. е. равны какому-то постоянному числу Ь. В част­ ности,

1

df {х) ,

xf (х)

dx

Мы получили простое дифференциальное уравнение пер­ вого порядка, из которого и найдем f(x). Для этого запишем уравнение в виде

df (х)

bx dx,

fix)

 

откуда после интегрирования получим

1 п /(д :)= ^ + 1пС, / (х) = СеЬх'/*

3.1. ПРИМЕР НОРМАЛЬНОГО Р А С ПР Е ДЕ Л ЕН И Я

57

Уточним смысл постоянных 6 и С, исходя из того, что для / (х), как и для всякой плотности,

CD

^ f (х) dx = 1.

—ао

Отсюда сразу же видно, что b не может быть положительным (не будет сходиться интеграл). Поэтому можно положить Ь=h2. Это же равенство позволяет выразить С через h.

Действительно,

ао

J Ce-htxt' 2dx= 1,

откуда

h

/2 я

J e~h*xt/2dx

(стоящий в знаменателе интеграл вычисляется с помощью сложных методов; его значение можно найти в различных специальных таблицах определенных интегралов).

Итак, мы получили, что плотность распределения точек попадания снарядов вдоль любого направления определяет­ ся формулой

f(x)

П г -Ь*Хг/2

 

Здесь остается неопределенной постоянная h\ она зависит от условий стрельбы и называется точностью стрельбы. Нетрудно видеть, что чем больше точность, тем кучнее, ближе к цели ложатся снаряды.

Если бы цель (точка наводки) находилась не в начале координат, а была смещена в направлении оси Ох на рас­ стояние а, то для приведения к уже рассмотренному случаю нужно сделать замену х на ха. Это даст плотность рассея­ ния снарядов вдоль оси Ох в общем случае:

f(x) = — e-h4x-a)*/% п > V b i

Полученная функция и называется плотностью нор­ мального распределения.

58§ 3. НОРМАЛЬНОЕ Р А СПР ЕДЕ ЛЕНИ Е

3.2.Свойства нормального распределения. Нормальное распределение играет основную роль в дальнейшем изло­ жении. Поэтому изучим предварительно его свойства.

Случайная величина £ называется распределенной по нор­ мальному закону, если ее функция распределения имеет вид

 

X

F(x) = - ^ =

С e-h^* -aV-i*dx.

4 ' / 2 л

J

Такая величина, очевидно, является непрерывной.

Найдем математическое ожидание и дисперсию нормаль­ но распределенной случайной величины. Для математиче­ ского ожидания получим

CD

М £ = - ^ = f xe-h*'x- aF'*dx.

/2л J

Введем новую переменную t = xа, тогда dx=dt, а пределы интегрирования не изменятся. Мы получим:

М£ = -^h= [ (t + a ) e ~ h 4t ' 2 d t =

 

у

J

 

 

 

—00

 

 

= -^ =

? t e - h 4t ' * d t +

- ^

? e ~ ht‘l / * d t .

/2 л

J

/2 л

J

Первый из получившихся интегралов равен нулю, так как подынтегральная функция нечетна, а пределы интегриро­ вания симметричны относительно нуля. Второй интеграл

/2 ^

гг

уже встречался в предыдущем пункте, он равен -

.По­

этому окончательно

 

М£ = а.

 

Применительно к примеру предыдущего пункта мы полу­ чаем, что точка наводки (цель) есть математическое ожида­ ние случайных попаданий снаряда — результат, еще раз подтверждающий смысл математического ожидания как среднего, наивероятнейшего значения случайной величины.

3.2. СВОЙСТВА НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

59

Перейдем к вычислению дисперсии. Согласно общей

формуле

ао

DЪ= у = § {x— a f e - ^ - ^ d x .

Введем новую переменную t=h —а), тогда dx = ^-dt, а

пределы интегрирования не изменятся. Мы получим, что

D

Д =

Г

__1__

j t4-*4'dt.

 

|/"2л

J

/i2 |^2л

 

Полученный интеграл будем вычислять по частям, полагая и = /, dv = te~tt/2 dt. Тогда du=dt,

v = j te-**'* dt = j e- '2/2 d ( д ) = —£?-'2/2.

Поэтому

/г2 2 л

"со + j e~'V2^)

01

 

Выражение—te~t2/z при подстановке oo и —oo вместо t обра­ щается в нуль (точнее говоря, оно стремится к нулю при /, стремящемся к оо или —оо). Оставшийся интеграл при­ надлежит к типу, уже неоднократно встречавшемуся рань­

ше; из таблиц находим, что он равен Y 2я. Это приводит нас к окончательной формуле для дисперсии:

Для примера с рассеянием снарядов дисперсия обратно пропорциональна квадрату точности. Чем выше точность, тем меньше дисперсия, следовательно, и здесь дисперсия может служить мерой рассеяния.

Среднее квадратичное отклонение нормально распреде­ ленной величины называется стандартом и обозначается

буквой а. Отсюда D£=cr2 и, следовательно, о =

С по­

мощью стандарта плотность нормального распределения

60

§ 3. НОРМАЛЬНОЕ Р А СПР ЕДЕ ЛЕНИ Е

запишется в виде

 

 

 

1

 

е (х—а.)1/гагi

 

/(*) = о У 2л

а функция распределения

X

 

 

 

 

 

F(x) = —

[

e-i*-'*'** dx.

 

о уг 2л

J

 

Именно этими формулами мы и будем пользоваться в даль­ нейшем.

График плотности нормального распределения назы­ вается нормальной кривой или кривой Гаусса. Он зависит от значений а и сг; на рис. 12 представлена нормальная кри­ вая при а=2, а=0,5.

Нормальная кривая сим­

метрична

относительно

прямой

х= а

и

при

х-> ± оо

неограниченно

приближается

к

оси

абсцисс (эта ось

являет­

ся

асимптотой

кривой).

При х= а

кривая

име­

ет

максимум,

равный

 

1

 

 

 

о\Г2л Если вокруг каждой точки оси абсцисс взять небольшую

окрестность заданного радиуса е *), то вероятность попада­ ния в такой интервал пропорциональна значению плотности в рассматриваемой точке (с точностью до бесконечно малых более высокого порядка, чем е). Непосредственно из гра­ фика видно, что для нормального распределения наиболее вероятно попадание в окрестность математического ожида­ ния, а в обе стороны от него эта вероятность монотонно убывает. Скорость убывания при этом зависит от крутизны нормальной кривой, которая в свою очередь зависит от о. На рис. 13 приведены для сравнения три нормальные кри­ вые при а= 0 и различных о. Мы видим, что чем меньше а,

*) Окрестностью радиуса е для какой-либо точки х называется ин­ тервал длины 2е с центром в этой точке.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]