Методы оптимизации эксперимента в химической технологии
..pdfкого правдоподобия. Оценки, полученные при помощи этого метода, отвечают большинству изложенных требований.^Сущность метода максимального правдоподобия заключается в нахождении таких оценок неизвестных параметров, для которых функция правдоподобия при случайной выборке объема п будет иметь максимальное значение^ Пусть известен общий вид плотности вероятности f(x, а) теоретического Распределения; а —неизвестный параметр, входящий в выражение закона Распределения. На опыте получена выборка значений случайной вели чины х }, х 2, хп. Окружим каждую точку х,- окрестностью длины е.
Вероятность попасть в интервал с границами xt — |
xi + ~ при |
2
ближенно равна f(xit а)е. Если произведено п наблюдений, то ве роятность, того, что одновременно первое наблюдение попадает в пер вый интервал, второе —во второй и т. д., есть вероятность совмест ного осуществления событий и в силу независимости событий равна произведению вероятностей;
Р(х, a) = f (Xl)f(x2) ... f(xn)z«. |
(II.8) |
Событие с вероятностью Р осуществилось на самом деле. Естественно ожидать, что событию, осуществившемуся при первом же испытании, со ответствует максимальная вероятность. Поэтому в качестве оценки для а следует взять то значение а* из области допустимых значений параметра я, для которого эта вероятность принимает наибольшее воз можное значение, т. е. корень уравнения
дР(х%а) |
= 0, |
(II.9) |
|
да |
|||
\а=а* |
|
представляющего собой необходимое условие экстремума вероят ности Р. Достаточным условием максимума при этом является выпол нение неравенства
да2 |
< 0 . |
(11.10) |
|
|
Если максимумов несколько, необходимо выбрать среди них наиболь ший. Решение проще получить, если перейти к функции
п
Ц х , а) ~ In ~ |
«)■ |
( И - 11) |
i Si
которая называется функцией правдоподобия. Вероятность Р и функ ция L имеют максимумы при одних и тех же значениях определяемых параметров, так как
да In /> = |
дР |
п |
(11.12) |
Р ~да |
, Я > 0 . |
В общем случае требуется оценить одновременно несколько пара метров одномерного или многомерного распределения. Если а и х понимать как векторы, то формулировка принципа максимального правдоподобия сохранится: надо найти такую совокупность допустимых значений параметров я* , а* , , которая обращает функцию правдо-
подобия в максимум. Необходимые условия экстремума дает система уравнений
dL (xt ах |
= 0, / = 1 , 2 , |
(11.13) |
|
даг |
|||
|
|
а неотрицательная определенность матрицы
a2L |
/ = 1,2, |
(11.14) |
|
(■doi даj |
|||
|
|
является достаточным условием того, чтобы локальный экстремум был максимумом функции правдоподобия.
Найдем методом максимального правдоподобия оценку парамет ра X показательного распределения с плотностью
/ ( * ) = Хе Хдг, 0 с JC < оо
по выборке хи х2, ..., хп.
Для этого распределения функция правдоподобия имеет вид
п |
п |
|
^ = |
ХХ/) = л1пХ — 2 ^ / - |
(11.15) |
/=1 |
i=\ |
|
Дифференцируя (11.15) по А, и приравнивая производную нулю, получим уравнение
- Г - ■S =
откуда находим оценку А* параметраX:
А* = |
п |
|
|
(11.16) |
|
2 |
|
» |
f=l |
|
или X* = 1 / х, где х —среднее выборки.
Пусть распределение случайной величины X подчинено нормальному закону:
/(* ) = |
1 |
ехр — ( х - т ? |
| |
У |
2*о* |
2оа |
} * |
|
|
Тогда вероятность совместного осуществления п независимых собы тий X=XjQ= 1, 2, ..., п) равна
Р(х, т , |
о2) = |
ехр |
|
(11.17) |
|
(2*о2)П/2 |
|
*=1 |
|
|
|
|
|
|
и функция правдоподобия |
|
|
|
|
Р |
= — ——In 27i — — |
In о2 — — |
(11. 18) |
|
L (Ху т , о2) — In — |
||||
ел |
|
|
2оа |
|
1= 1
Продифференцируем (11.18) по т и ст2;
dL 2 V I
Так как 1/а2=^0, из (11.19) имеем |
(xt — т) = 0, откуда находим оценку |
||||||
х для параметра т: |
|
|
i-l |
|
|
|
|
|
|
11 |
|
|
|
||
|
|
- |
|
|
|
||
|
|
1 |
|
|
|
||
|
|
* = |
--- |
|
|
|
|
|
|
|
П § |
*1- |
|
|
|
Дифференцируя функцию правдоподобия по а 2, получим |
|
||||||
0L |
п |
1 . |
1 |
Д * ,- т )’ = |
0, |
( 11. 20) |
|
да2 |
2 |
о* |
2(о2)2 |
||||
|
|
|
|||||
|
|
|
|
= 0. |
|
|
|
Так как 1/(2 а2) ^ , |
имеем |
п |
|
|
|
||
|
|
|
|
|
|
||
|
" - “ Г |
< * -« )• = о, |
|
|
i=l
откуда находим оценку
2 U - * ) 2
( 11. 21)
3. Оценка математического ожидания и дисперсии. Метод максималь ного правдоподобия всегда приводит к состоятельным, хотя иногда и смещенным оценкам, имеющим наименьшую возможную дисперсию при неограниченном возрастании объема выборки. Для нормально распределенной случайной величины получают оценки следующего вида: среднее арифметическое Зс для математического ожидания тх
* = 2 х'!п
t=\
и выборочную дисперсию ^ для дисперсии D[X]
*’ = £(■X i - x f l n .
1=1
Последняя оценка получается несколько смещенной:
Для получения несмещенной оценки ^ надо умножить на п/(п—)\
|
п |
п |
(И.23) |
S2 |
п — 1 |
2 (xt — л:)2/(/г — 1). |
|
|
t=l |
|
Уменьшение знаменателя в (11.23) на единицу непосредственно свя зано с тем, что величина Зс, относительно которой берутся отклонения, сама зависит от элементов выборки. Каждая величина, зависящая от элементов выборки и входящая в формулу выборочной дисперсии, называется связью. Можно доказать, что знаменатель выборочной дисперсии всегда равен разности между объемом выборки п и числом связей /, наложенных на эту выборку. Заразность
f = n - l |
(П.24) |
называется числом степеней свободы выборки. В практических вычисле ниях для дисперсии ^ часто удобна формула
|
|
|
|
|
п |
|
|
(11.25) |
легко вытекающая из (11.23): |
|
|
|
|||||
|
|
|
|
|||||
|
|
|
s |
U - *)2 |
|
|
|
|
S2= |
- |
^ |
------------ : |
|
2xix + |
*2) |
||
|
|
|
|
п — 1 |
|
|
|
|
= |
п ^_ t |
[( А — 2*!*+ я2) + (.*! — 2*2 * + |
X2) Н-------h |
|||||
+ |
( |
— 2х„х + х2)] = n _ ( |
[( xf + 4 |
+ |
-----f |
xj) — |
||
|
— 2х |
(хх + х2 ч------- \- х„) + |
(х2 + X2 + |
• • • |
+ ха)] = |
__ 1_
п — 1
Преимущество формулы (11.25) в том, что в ней нет операций вычита ния близких чисел, как в формуле (11.23), что приводит к потере точ ности. В формуле (11.25) эта операция применяется только один раз. Среднее и дисперсию выборки по сгруппированным данным табл. 1 вычисляют по формулам
k k
1=1 |
i= 1 |
п |
k |
|
* - * Y Р* 12 |
||
п — 1 |
Величина fc/\2 называется поправкой Шеппарда, она связана со смеще нием дисперсии при группировании.
4. Классификация ошибок измерения. Каждый результат измерения — случайная величина. Отклонение реального результата от истинного называется ошибкой наблюдения. Ошибка наблюдения также есть слу чайная величина —она является результатом действия только случайных (неучитываемых) факторов. Если обозначить истинный результат через я, ошибку —через АЛ", результат измерения —через Л", то
X —а = АХ. |
(11.28) |
Различают ошибки трех видов.
1. Грубые ошибки возникают вследствие нарушения основных усло вий измерения. Результат, содержащий грубую ошибку, резко отличает ся по величине от остальных измерений. На этом основаны некоторые критерии исключения грубых ошибок.
2.Систематические ошибки постоянны во всей серии измерений или изменяются по определенному закону. Выявление их требует спе циальных исследований, но как только систематические ошибки обна ружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения.
3.Случайные ошибки —ошибки измерения, остающиеся после устране ния всех выявленных грубых и систематических ошибок. При таком определении к случайным факторам, порождающим случайную ошибку, не относят факторы с постоянным действием (систематические ошиб ки) и факторы с однократным, но очень сильным действием (грубые ошибки). Случайные ошибки вызываются большим количеством таких факторов, эффекты действия которых столь незначительны, что их нельзя выделить в отдельности (при данном уровне техники измерения). При этом распределение случайных ошибок симметрично относительно нуля: ошибки, противоположные по знаку, но равные по абсолютной величине, встречаются одинаково часто. Из симметрии распределения ошибок сле дует, что истинный результат наблюдения есть математическое ожидание соответствующей случайной величины. Так как из (11.28) Х = а+ А Х и при отсутствии грубых и систематических ошибок
М [ДХ] = 0, |
(11.29) |
то |
|
М[Х] = а. |
(11.30) |
В дальнейшем будут рассматриваться только случайные ошибки измере ний.
5. Закон сложения ошибок. Для независимых случайных величин свойством аддитивности обладают дисперсии, а не среднеквадратичные ошибки. Если Хи Х2, Хп —независимые случайные величины; аь аъ ..., ап—неслучайные величины и
Z —а1Х1 + а2Х2+ • • • + а>пХ-п. |
(11.31) |
35
то выборочная дисперсия величины Z определится следующим образом:
|
|
s2 _ |
2„2 |
|
--- + < 8 |
(11.32) |
||
|
|
sz — а\ sxt + 4 4 , + |
||||||
Если положить яt = а2 = .. .=а„ = 1/п, то |
|
|
|
|
||||
|
|
7 _ |
Хг+ |
Xt + • • • |
+Xn |
|
v |
|
|
|
Z = |
|
n |
■— Л. |
|
||
В этом случае |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
2 |
s% + |
s*. ^--------ь 4 n |
= |
2 L |
(11.33) |
|
|
|
sx — |
|
n2 |
|
|||
|
|
|
|
|
|
n |
|
|
, |
2 4 |
, |
|
|
|
|
|
|
-2 |
t=i |
1 |
|
|
|
|
|
|
где
Если величины Xv Х2, ..., Хп интерпретировать как п независимых на
блюдений одной и той же случайной величины Z, то 3* =: |
**• |
*$* |
|
Тогда получим |
|
|
(11.34) |
4 |
= Ь2у/я. |
|
|
х |
Л |
|
|
Из выражения (11.34) следует практический вывод: при оценке точности двух методов следует учитывать длительность анализа. Применяя менее
точный экспресс-метод, можно сделать за то же время значительно большее число опытов и добиться более высокой точности, чем дает трудоемкий точный метод.
6. Ошибки косвенных измерений. Измерения делят на прямые и
.косвенные. В первом случае непосредственно измеряется определяемая величина, при косвенных измерениях она задается некоторой функцией от непосредственно измеряемых величин. Пусть случайная величина z зависит от наблюдений хи ..., хп по известному закону:
* = *2, ... , хп).
Истинное значение величины z может не совпадать с математическим ожиданием Мг, а определяться тем же законом:
г= /(л |
т |
тО |
|
||
Величина а2 называется средним косвенного измерения. |
||
Дисперсия косвенного измерения |
а | определяется так же, как |
обычная дисперсия, только отклонения берутся от среднего косвенного измерения az. Ее можно найти, зная дисперсии отдельных наблюдений и вид функции / На практике определяют выборочные дисперсии да. и по ним выборочную дисперсию косвенного измерения &z , которая служит оценкой генеральной дисперсии Чтобы найти $ , разложим функцию z=f(xv х2> хп) в ряд Тейлора в точке (mX)i mx<i9 ограничиваясь членами первого порядка
df
.......’ т*п) + 1 £ 1 Х1- п Л +
df |
df |
:-S №
Выражение (11.36) называют законом накопления ошибок.
Пример 1. Оценить ошибку определения линейной скорости движения газа в трубо проводе у, пользуясь следующими результатами измерений: количество газа G = 3000 мз/ч; ошибка-1СМ2измерения. sG —10 мз/ч; сечение трубопровода F —0,1 м2; ошибка измерения
SF
Р е ш е н и е . Рассматривая линейную скорость как результат косвенного измерения
G3000
v= — = - = 30000 м/ч = 8,82 м/с,
определим по формуле (11.36):
-1 / |
G2 |
= |
|
F4 |
|||
|
|||
|
|
||
|
V 1• 10~а - 102 + 9 • 10* • 10-8 = 0,03 м/с. |
|
|
|
1 . 10-2 • 3600 |
|
7. Определение дисперсии по текущим измерениям. Математическое ожидание (среднее) и дисперсия генеральной совокупности оцениваются средним и дисперсией выборки тем точнее, чем больше объем выборки. При этом среднее характеризует результат измерений, а дисперсия — точность этого результата (дисперсия воспроизводимости) (см. гл. II, §4). Если проделано т параллельных опытов (опытов, проведенных при неизменном комплексе основных факторов) и получена выборка yv у2, ..., ут значений измеряемой величины, то дисперсия воспроизводи мости равна
т т
|
2 — у)г |
2 |
у» |
s* |
= - “=!--------------- , гдеу= — |
— |
|
воспр |
m — 1 |
* |
т |
и ошибка опыта (ошибка воспроизводимости) |
|
||
|
SBOCnp—Y |
SBOCnp* |
|
Часто для оценки точности применяемой методики ставят специаль ную серию опытов, многократно повторяя анализ одной и той же прооы. На проведение большой серии опытов требуется много времени, в течение которого может неконтролируемым образом измениться сред нее значение результатов анализа. Значительно проще и удобнее опреде лять ошибку воспроизводимости по текущим измерениям.
Предположим, анализируются п проб. При анализе каждой про ы
делается различное число параллельных опытов: mv т2, |
Мп- Вычис |
|
лим частные дисперсии & , д2 , ..., |
для каждой такой выборки в от |
дельности. Число степеней свободы частных дисперсий соответственно
равно: f } =т] - 1, f 2 = m2- 1, f n=mn - 1. Общая дисперсия воспроиз водимости всех опытов будет равна средневзвешенному значению част ных дисперсий (в качестве весов берутся степени свободы):
|
а |
/l5?"Ь /2S2"Ь ***"Ъ /nsn |
|
|
|
SflOCnP ~~ |
/1 + /»+■•• + /n |
|
|
= |
(mj— l)s?+(m2—l)s? Ч------- |
H(mn —Os^ |
» |
|
--------------- |
7----■ ' , ----------------------(П-37) |
|
||
|
m1 + m2-\- • • • + |
mn — л |
|
Число степеней свободы общей дисперсии равно общему числу изме рений минус число связей, использованных для определения п средних:
п |
mi —Пт |
(11.38) |
/воспр = т\ + т 2 + ***+ тп — п = 2 |
||
t = |
l |
|
Учитывая, что частные дисперсии определяются по результатам парал лельных опытов по формуле
|
2 |
(уы — yi)2 |
|
|
|
||
|
2 и= 1 |
|
|
, i= 1, 2, . . . , л, |
|||
|
St — |
mi — |
1 |
||||
из (11.37) имеем |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
(mt — I) + (m2— 1) S2Ч-------h (mn — 1) s° |
||||||
S BOCnp |
|
« 1 4- m24-------hffln- я |
|
||||
|
|
|
|||||
|
|
|
„ |
|
2 |
|
— </Л2 |
2 |
(m«~ 1)4 |
2 |
(mf — 1) “=1 |
m* — 1 |
|||
i=i________ |
1=1 |
n |
|
||||
П |
|
|
|
|
|
||
2 |
m,- я |
|
|
2 |
m«” n |
|
|
i=i |
|
m, |
t = |
l |
|
|
|
|
|
n |
|
|
|
|
|
|
|
2 |
2 |
—у*)2 |
|
|
|
|
|
|
u = 1 |
|
|
(11.39) |
|
|
|
|
Я |
f |
|
|
|
|
|
|
|
|
|
||
|
|
|
2 |
mt — n |
|
|
|
|
|
|
1=1 |
|
|
|
|
Если число параллельных опытов при анализе каждой пробы одина |
|||||||
ково т}=т2 = ... = тп =т, формулы для |
расчета дисперсии воспроиз |
||||||
водимости упрощаются. При этом |
|
|
|
|
2
S BOCnp
( m - l) ( s ? 4-sf+ - -- + s 2) |
(m~ 0 S |
* |
(11.40) |
|
mn — n |
n(m— 1) |
n |
||
|
Таким образом, при равном числе параллельных опытов общая дисперсия воспроизводимости равна среднеарифметическому значению частных дисперсий. Число степеней свободы общей дисперсии при
этом равно
И окончательно
лт
а |
2 |
2 (yiu—y if |
|
_ |
|
(11.42) |
|
S B o cn p |
|
п ( т — 1) |
|
|
|
|
Число степеней свободы у общей дисперсии воспроизводимости, определяемой по формулам (11.39) и (11.42), гораздо больше, чем у каждой частной дисперсии в отдельности. Поэтому общая дисперсия воспроиз водимости намного точнее оценивает дисперсию генеральной совокуп ности ав2оспр.
При вычислении дисперсии воспроизводимости по текущим измере ниям объединяют между собой только те пробы, которые можно рас сматривать как выборки из генеральных совокупностей с равными
дисперсиями. При этом каждое из значений ^ |
^ , ..., |
можно рас |
||||||
сматривать как оценку одной и той же генеральной дисперсии. |
|
|||||||
Пример 2. Результаты определения |
концентрации (%) Р2О5 в системе (NH^HPCU - |
|||||||
- К2СО3 - Н2О колориметрическим методом приведены в таблице. |
|
|
||||||
Определить ошибку колориметрического метода по текущим измерениям. |
|
|||||||
Н омер |
|
|
|
Н ом ер |
пробы |
|
|
|
опыта |
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
2 7,9 |
19,3 |
4 ,5 |
22,3 |
10,8 |
16,3 |
8,8 ‘ |
12,6 |
2 |
2 7 ,2 |
19,7 |
5 ,2 |
23,5 |
8 ,9 |
1 5 ,8 |
8 ,7 |
13,5 |
3 |
26,8 |
— |
4 ,8 |
21,7 |
— |
17,2 |
9 ,2 |
13,3 |
Ъ уи |
8 1 ,9 |
3 9 ,0 |
14,5 |
6 7 ,5 |
19,7 |
4 9 ,3 |
2 6,7 |
3 9 ,4 |
Z y j |
2 2 3 6 ,4 9 |
7 6 0 ,5 8 |
7 0 ,6 9 |
1 5 2 0 ,4 3 |
1 9 5,85 |
8 1 1,17 |
2 3 7 ,7 7 |
5 1 7 ,9 0 |
m i |
3 |
2 |
3 |
3 |
2 |
3 |
3 |
3 |
Р е ш е н и е . По данным таблицы вычислим sf по формуле
а |
|
1 |
|
2 Уа |
|
2 \ и=1 |
|||
s i |
= |
mi— 1 |
ya |
rn J |
|
|
|
Для вычисления общей дисперсии по формуле (11.37) понадобятся слагаемые вида
mt
2 уи
а \и= 1
si (пц — 1) = Уи—----—
пц
и = \
(mi — 1)s* = 2236,49 — ——— |
= 0,62. |
|
|
О |
|
Аналогично |
|
|
(m2— 1) = 0,08; |
(т3 — 1) s§ = 0,61; |
(т4— 1) s* = 1,68; |
(т8- l)s|= 1,805; |
(тв — 1) sg = 1,01; |
(яц - 1) s?= 0,14; |
(та — 1) sg = 0,045.
Число степеней свободы общей дисперсии воспроизводимости равно
8 8
|
/в осир — |
2 |
/* = |
2 |
mi — 8 = 22 — 8 = |
14. |
||
|
|
t=l |
|
i=i |
|
|
|
|
И дисперсия воспроизводимости |
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 |
_ |
2 sih |
5,99 |
|
|
||
|
1=1 |
|
= 0,4279. |
|
||||
|
воспр |
|
/воспр |
14 |
|
|||
|
|
|
|
|||||
Ошибка колориметрического метода, определенная по текущим измерениям, равна |
||||||||
|
sBocnp = |
У * * * „ „ |
= |
/ М |
279 = 0 ,6 5 4 . |
|
||
8. |
Доверительные интервалы и доверительная вероятность. Выбороч |
|||||||
ные параметры являются случайными величинами, их отклонения от |
||||||||
генеральных (погрешности) |
также |
|
будут |
случайными. |
Оценка этих |
отклонений носит вероятностный характер —можно лишь указать вероят ность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероят ностями.
Пусть для генерального параметра а получена из опыта несмещен ная оценка а*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность Р —такую, что событие с вероят
ностью |
Р можно считать практически достоверным, |
и найдем такое |
значение |
е =Д Р ) = ер , для которого |
|
|
Р ( Iа*— а | < ер) =р. |
(11.43) |
При этом диапазон практически возможных значений ошибки, возни кающей при замене а на д*, будет ± гр, большие по абсолютной величине ошибки будут появляться только с малой вероятностью
P = 1 - Р . |
( I I . 44) |
называемой уровнем значимости. Уровень значимости часто выражают в процентах. Иначе выражение (11.43) может быть интерпретировано как вероятность того, что истинное значение параметра а лежит в пре делах