книги / Автоматизация научных исследований
..pdfГЛАВА 4. СТАТИСТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ
4.1. Генеральная и выборочная совокупность случайной величины X
Случайной величиной X называется величина, которая в результа те опыта (измерения, эксперимента) принимает то или иное конкретное значение, причем заранее неизвестно, какое именно значение. Важ нейшее значение дня описания некоторой случайной величины X имеет функция распределения вероятностей
F{x) = Р{Х < х}, |
(4.1) |
где Р - вероятность выполнения неравенства, заключенного в скоб ки; х - конкретное значение случайной величины X.
На рис. 4.1 показана схема измерения случайной величины X.
Исследуемый |
Датчик |
|
объект |
||
|
Рис. 4.1
Случайная величина X на рис. 4.1 описывает какое-то случайное явление, происходящее в исследуемом объекте.
Генеральной совокупностью случайной величины X называется множество Q возможных значений случайной величины X. Объем генеральной совокупности - это число элементов множества £2.
Выборочной совокупностью или выборкой объема п случайной величины X называется последовательность хг х2,...,хп независимых
наблюдений (значений) случайной величины X. Выборка х,,х,
взята из генеральной совокупности. Значения x,,x2,...,x„ называются
элементами выборки.
Выборка должна обладать рядом свойств. Требуемые свойства выборки следующие:
1)выборка должна быть представительной, т.е. она должна дос таточно хорошо отражать свойства генеральной совокупности, т.е. свойства случайной величины X ;
2)все элементы выборки должны иметь тот же закон распределе ния, что и случайная величина X ;
3)все элементы выборки есть независимые наблюдения случай ной величины X.
4.2. Задачи, решаемые при статистической обработке результатов измерений случайной величины X
Перечислим некоторые задачи, решаемые при статистической об работке результатов измерений случайной величины X Эти задачи следующие:
1) нахождение оценок для функции распределения вероятностей F(x) или для плотности распределения вероятностей /|(х) случай ной величины X, т.е. нахождение оценки для закона распределения случайной величины X ;
2)нахождение точечных и интервальных оценок для параметров закона распределения случайной величины X , вид которого известен;
3)проверка статистических гипотез о значениях параметров зако на распределения случайной величины X, вид которого известен;
4)проверка статистических гипотез о виде неизвестного закона распределения случайной величины X ;
5)задачи корреляционного анализа, т.е. исследование связи меж ду двумя случайными величинами X и Y, исследование степени бли
зости этой связи к функциональной зависимости у = /( х ) .
Кроме того, могут рассматриваться задачи дисперсионного анали за, регрессионного анализа и т.п.
4.3. Оценивание по выборке статистических характеристик случайной величины X
Оценки статистических характеристик случайной величины X могут быть следующими:
1) оценка функции распределения вероятностей случайной вели чины X;
2)оценка плотности распределения вероятностей случайной ве личины X;
3)оценка математического ожидания случайной величины X;
4)оценка дисперсии случайной величины X ;
5)оценка начальных моментов порядка v = 1,2,... случайной ве личины X;
6)оценка центральных моментов порядка v = 1,2,... случайной
величины X.
В табл. 4.1 приведены формулы для определения статистических характеристик и оценок статистических характеристик случайной ве личины X.
Таблица 4.1
Статистическая характеристика случайной величины X
1. Функция распределения вероятностей
F (x ) = P { X < х )
2. Плотность распределения вероятностей
Ах\ |
Дх2 |
Axv |
|
Ахг |
|
__ I__ ь ы _ _ _ |
_ |
_ b_ i_r_ d ______► |
|
|
|
|
|
X |
|
р |
|
|
|
f v — |
\ f i ( . x ) d x ; |
v = 1,2,...,г, |
Ру |
- вероятность |
|
Дгу |
|
|
|
попадания случайной величины X |
в интервал Axv |
3. Математическое ожидание
0 0
т.т= \xfi<X)dx
-0 0
4.Дисперсия
со
o l = ^ { x - m xf f ^ x ) d x
-0 0
5.Начальный момент порядка v = 1,2,...
mv = *\xvf ,( x )d x
- о с
6. Центральный момент порядка v - 1,2,...
о с
Pv= \ { x - m :ry f ^ x ) d x
- 0 0
Оценка статистической характеристики случайной величины X
1. Оценка функции рас пределения вероятностей
Лп
F„(x) = — ; где п х - число
п
х ,, / = 1,2,..., меньшие х
2. Оценка |
|
плотности |
рас |
|||
пределения вероятностей |
||||||
Л |
|
Л |
|
л |
|
|
_ |
Р |
1 |
п |
_ |
||
г |
|
V |
"v. .о |
|||
J V |
|
Дху |
|
- |
» |
|
|
|
|
|
п |
|
|
«у |
- |
число |
* , , ( / = 1,2,...), |
попавших в интервал Дху,
v = 1,2,..., г ;
Л
Л- - частота попадания в
интервал Axv
3. Оценка математическо-
Л J И го ожидания т* = — У х,
Я /=1
4.Оценка дисперсии
П/=!
5.Оценка начального мо мента порядка v = 1,2,...
Л1 П
Wv= - £ T,V
Я,=|
6. Оценка центрального
момента порядка
v = 1,2,...
Л |
п |
1 |
Л |
я
Из приведенной табл. 4.1 видно, что любая оценка 0„ параметра 0 является функцией от элементов выборки х,,х2,..., хп,
л |
(4.2) |
0„ = ф(х,,х2,...,х„). |
Любая функция от элементов выборки называется статистикой. Поскольку элементы выборки могут принимать от выборки к выборке
л
случайные значения, то 0„ является случайной величиной как функ ция системы случайных величин.
Оценки параметров закона распределения случайной величины X делятся на точечные и интервальные. Точечная оценка параметра 0 оп-
л
ределяется одним числом 0„ = ф(х,,х2,...,х„). Интервальная оценка ха-
А |
А |
|
|
|
|
рактеризуется двумя числами 0i |
и 02 - концами интервала, который |
||||
содержит в себе оцениваемый параметр 0. |
|
|
|
|
|
Пример 4.1. Закон распределения (плотность распределения веро |
|||||
ятностей) случайной величины X имеет два параметра 0, и 02 |
|||||
/I (X, 0,, 02) = /; (х, тх,ст2г) = - = 1 = е |
(Х-П'х)2 |
|
|||
|
2о? |
(4.3) |
|||
|
у/2п<т2 |
|
|
7 |
|
|
А |
А |
А |
А |
|
|
* |
Здесь 0, = тх; 02 = а 2х. Следовательно, 0i = тх; 02 = <т.г.
4.4. Общие свойства точечных оценок
Одна из основных задач статистической обработки результатов измерений заключается в таком выборе функции ср(х,,х2,...,хл) , что-
л
бы оценка 0» с возможно большей точностью характеризовала оце ниваемый параметр 0.
Рассмотрим свойства точечных оценок. Свойство 1 заключается
А
в следующем: оценка 0„ = ф(х,,х2,...,х„) называется несмещенной, ес ли ее математическое ожидание равно оцениваемому параметру 0, т.е.
М[0„ ] = А/[ф(х,,х2,..., х„)] = 0. |
(4.4) |
А
Оценка 0„ называется асимптотически несмещенной, если (рис. 4.2)
НшА/[0„] = НтМ[ф(х1,х2,...,х„)] = 0. |
(4.5) |
Оценка 0„ называется смещенной, если (рис. 4 .3 )
А/[9„]=е+бя(е), |
(4 .6 ) |
л
где Ьп(0 ) - смещение оценки 0 „.
На рис. 4.3: /|( 0 „) обозначает плотность распределения вероятно-
л
стей оценки 0 „.
л
Из (4.6) и рис. 4.3 видно, что если 6„(0) = 0 , то оценка 0 „ являет
ся несмещенной.
л
Свойство 2 точечных оценок заключается в следующем: оценка 0„ является состоятельной, если точность оценки возрастает с увеличением
объема выборки п, а при п -> оо оценка 0 П сходится по вероятности
к 0, т.е. (рис. 4.4) |
|
|
Л |
\ |
|
НшЛ 0 л —0 > 8 |
= 0 , |
(4.7) |
|
) |
|
где е - любое сколь угодно малое положительное число.
л
Достаточным условием состоятельности оценки 0„ является схо
димость 0 „ к 0 в среднеквадратическом |
смысле, т.е. |
||
/ |
Л |
2 |
^ |
lim М |
0 л- е |
|
(4.8) |
Л->оо |
|
|
) |
\ |
|
|
Достаточное условие состоятельности смещенной оценки 0 « по-
л
ясняет рис. 4.5, а несмещенной оценки 0„ - поясняет рис. 4.6.
На рис. 4.6 £>[0] обозначает дисперсию оценки 0„.
л
Для несмещенной оценки 0„ имеем
£>[0„] = М[(0„- М[к])2] = М [ ( к - 0)2] . |
(4.9) |
Д ля смещенной оценки 0„ с учетом соотношения (4.6) получим (0 „ - 0 ) 2 =[(0 „-Л/[0 „]) + 6„(0 )]2
ИЛИ
(0 „ - 0 ) 2 =(0 „-М [0 п])2 |
+2^(0Х0»-Л/[в»]) + ^(0)- |
(4.10) |
Из (4.1 0 ) с учетом (4.9) имеем |
|
|
А/[(0„ - 0) 2 |
] = Д0„ ]+ 6 2(0). |
(4.11) |
Свойство 3 точечных оценок заключается в следующем: несме-
л
щенная оценка 0 „ называется эффективной, если дисперсия оценки
А
Z)[0„] имеет минимальное значение (рис. 4.7).
На рис. 4.7 обозначено: Dmin - минимальное значение дисперсии
лл
оценки £>[0 „]; 0 „Эфф - эффективная оценка параметра 0 .
А л
Если для несмещенных оценок 0„,i и в„ , 2 параметра 0 справед ливо неравенство вида
М[(0 „,,- 0) 2] < М[(к,2 - 0) 2 ], |
(4 .1 2 ) |
А |
Л |
то оценка 0 „,i является более эффективной, чем оценка 0 „,2 . Свойство 4 точечных оценок заключается в следующем: оценка
Л
0 л = ф(х,,х2,...,хп) называется достаточной, если она содержит всю информацию об оцениваемом параметре 0 , содержащуюся в выбор-
л
ке. Оценка 0Яявляется достаточной тогда и только тогда, когда мож но найти две неотрицательные функции g] и g2 такие, что
л |
(4.13) |
L(x],x2,...,xn,Q) = gi(0/„0)- g2(x,,х2,...,х„), |
|
где |
|
Z(x, ,х2,..., х„,0) = /„ (х, ,х2,..., х„,0). |
(4.14) |
Здесь 1(х,,х2,...,х„,0) - функция правдоподобия; /,(х,,х2,...,х(,,0) - совместная плотность распределения вероятностей элементов выбор ки х,,х2,...,хп, которая определяется соотношением
/ й(х„х2,...,хя,0) = /;(х,,0 )у;(х2,0 )...у;(хн,0 ) . |
(4.15) |
Наилучшей оценкой из тех оценок, которые можно найти, являет-
л
ся оценка 0 И, которая одновременно является несмещенной, состоя тельной, эффективной и достаточной.
4.5. Методы получения точечных оценок параметров закона распределения случайной величины X
Предполагается, что вид закона распределения случайной вели чины X известен, а числовые значения параметров закона распреде ления неизвестны.
Существуют следующие методы получения точечных оценок па раметров закона распределения случайной величины X
1 ) метод моментов;
2 ) метод максимума правдоподобия;
3) метод Пирсона или метод минимума yj. Рассмотрим первые два метода.
|
4.5.1. Метод моментов |
|
||||
Метод |
моментов |
заключается |
в |
приравнивании |
моментов |
|
тг,\хг,г= 1,2,... к оценкам этих моментов |
л л |
|
||||
/и,,рг,/- = 1,2,... Пусть 0 - |
||||||
неизвестный |
параметр |
плотности |
распределения вероятностей |
|||
|
|
|
|
|
д |
|
f x(х, 0). Запишем формулы для определения ш,(0) и т\. |
|
|||||
Имеем |
|
|
|
|
|
|
|
|
/и,(0 )= |
Jx/j(x,0 )c&; |
(4.16) |
||
|
|
Л |
1 п |
Л |
|
(4.17) |
|
|
т\ = —Ух, = тх, |
||||
|
|
|
п ,=| |
|
|
|
л
где тх - оценка математического ожидания случайной величины X. Приравнивая (4.16) к (4.17), получим уравнение для оценки неиз
вестного параметра 0 вида
т](в) = тх. |
|
(4.18) |
|
|
л |
|
|
Решая это уравнение, находим оценку 0 неизвестного параметра 0. |
|||
Если по выборке х,,х2,...,х„ надо оценить к неизвестных пара |
|||
метров 0 ,,0 2,...,0 *, то надо |
найти 1 -й, 2 -й,..., |
к-и моменты |
закона |
распределения f x(х,0 ,,0 2,...,0 А.), |
|
|
|
/и,(0,,02,...,0*) = jV^x,©,,©,,...,© *)^,/ |
= 1,2,...,*, |
(4.19) |
|
|
л |
|
|
найти соответствующие оценки этих моментов т, , j - 1,2 ,...Д, |
|
||
ntj = |
х/ , j =1,2,..., к |
|
(4.20) |
пы
иприравнять их. Получим систему к уравнений с к неизвестными:
wy(0,,0,,...,0A.) = wj2, у =1,2,...,Л. |
|
(4.21) |
а л |
а |
неиз |
Решая систему уравнений (4.21), находим оценки 0 i,0 2,...,0 * |
вестных параметров 0 |;0 2,...,0 *.
Преимущество метода моментов - простота его применения. Недостатки метода следующие:
1 ) оценки не обеспечивают наименьший возможный разброс; 2 ) оценки при п —><х>не являются асимптотически эффективными;
3)оценки при п -> сюне являются асимптотически несмещенными;
4)закон распределения оценок при п —>оо является асимптотиче ски нормальным.
Пример 4.2. Найти методом моментов по выборке х,,х2 ,...,хя слу
чайной величины X точечную оценку X неизвестного параметра X показательного закона распределения, плотность распределения веро ятностей которого имеет вид
А(х,х) |
Хе кх, |
х > 0; |
(4.22) |
|
0 , |
х < 0 . |
|||
|
|
|||
Запишем формулы для определения т, (А.) и т\. |
|
|||
Имеем: |
оо |
|
|
|
|
|
(4.23) |
||
щ(Х) = |х/(хД)йЬг ; |
||||
|
-оо |
|
|
|
Л |
1 п |
Л |
(4.24) |
|
пи = —Ух,. =тх |
||||
|
п /=1 |
|
|
Приравнивая (4.23) к (4.24), получим уравнение для оценки неизвест ного параметра X вида
|
ди,(X) = тх. |
|
(4.25) |
Из (4.23) имеем |
|
|
|
|
оо |
оо |
(4.26) |
т}(X) = JxXe kxdx = XJxe lxdx. |
|||
Запишем табличный интеграл вида |
|
|
|
“ 2 |
а х |
а 2 |
(4.27) |
]xeaxdx =^-T (ax-\)I |
|||
«1 |
|
°ч |
|
где а ,а ,,а 2 - константы. |
|
|
|
Из (4.26) с учетом (4.27) получим |
|
|
|
|
-U |
|
|
w, (X) = X. |
■(-Тис-1 ) |
” = /,+ / 2 , |
(4.28) |
|
|
О |
|