Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Моделирование физико- химических процессов нефтепереработки и нефтехимии

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
31.95 Mб
Скачать

Глава I

Статистические методы анализа и планирования эксперимента в химической технологии

1. ОЦЕНКА ОШИБОК ИЗМЕРЕНИЯ

Назовем i-той ошибкой измерения разность р, — xt = z-t между истинным значением измеряемой величины р, и результатом изме­ рения а?;. Будем считать, что ошибки измерения являются случай­ ными, т. е. связаны с незначительными изменениями свойств измеряемой среды и приборов в ходе измерения; в них нет по­ грешностей, связанных с неточностями расчета или записи (гру­ бых ошибок) и со смещением нулевой точки приборов (системати­ ческих ошибок).

Повторяя измерения большое число раз, можно установить закон распределения случайных ошибок. Так, выделив некоторый интервал Ь—а, заметим, что отношение числа измерений т, в ко­ торых ошибка Zi попадает в этот интервал, к обпфму числу изме­ рений п (т. е. относительная частота попадания в интервал) стремится к постоянному значению при увеличении п. Можно принять, что отношение т/п характеризует вероятность Р попа­ дания случайной величины z в интервал b—а, и записать это следующим образом:

т

п

Соотношение, позволяющее рассчитать^ значение Р , называют законом распределения вероятностей. Поскольку выбор интервала произволен, удобнее рассмотреть вероятность попадания z в бес­ конечно малый интервал dz. Вероятность Р попадания z в интер­ вал а— b можно рассматривать как сумму (интеграл) вероятностей попадания z в бесконечно малый интервал dz:

ь

а

Функцию р (z) называют плотностью распределения, или диффе­ ренциальной вероятностью. Физический смысл ее состоит в том,

■И

что эта величина определяет вероятность ошибки, равной г. Понятно, что

0 0

 

Г

d p (z)

Р ( — o c < z < o o ) = j p ( z ) d z — 1

— ^ — = p(z)

- СО

 

Обычно выполняются следующие условия: 1) чем больше от­ клонения х от р, тем они реже (менее вероятны); 2) отклонения х от р в обе стороны равновероятны (т. е. одинаково часто встре­ чаются как положительные, так и отрицательные отклонения). При выполнении этих условий считают, что закон распределения ошибок является нормальным. Кривые р (г), соответствующие

Рис. 1-1. Зависимость р от г для нормального распределения:

а ~ при различных величинах а; б — для z, выраженного в. единицах о.

нормальному закону распределения, приведены на рис. 1-1,

Математическое соотношение для описания указанных кривых,

ОО

при котором выполняется условие J р (z)dz = 1, носит название

-О О

закона Гаусса и имеет вид;

 

 

 

 

 

 

 

 

 

 

1

(в-*)8

.

 

 

__z^_

 

 

 

 

20*

1

 

- ~ ftO*

 

 

(I.l>

 

Р (z) = aV2n

 

oV2n

 

 

 

 

 

Соотношение (1.1) впервые получено Муавром;

Гаусс

детально

изучил его и указал пути широкого применения.

 

 

 

Уравнение нормального закона распределения

содержит лишь

один параметр, характеризующий

точность

измерений:

а 2.

Чем

больше этот параметр, тем вероятнее большие

ошибки

(см.

рис. 1-1). Величину о2

называют

дисперсией,

а — стандартной

(квадратичной) ошибкой.

 

 

 

 

 

 

 

 

 

Из графика р (z) легко определить

вероятность Р

<< z <Zb)

Она определяется площадью, ограниченной кривой

р (z) и

ли­

ниями z =

а и z — &, что вытекает из уравнения для Р .

 

Удобно

характеризовать отклонение х

 

от

р

в

единицах а :

 

г =

= М

 

U — X

 

Z

 

 

 

 

(1.2)

 

 

 

= —

 

 

 

12

Подставив (1.2) в (1.1), получаем закон распределения для p(t):

Р (<) =

1

2

(1.3)

аУ 2л

 

 

Если построить кривую

по уравнению (1.3),

откладывая £

в единицах а, то получим график на рис. 1-1, б. С помощью этого графика, задав величину £, найдем отвечающую ей вероятность р (it). Вероятность попадания z в симметричный интервал от — £а до + to можно найти, удваивая площадь, ограниченную кривой и линиями z = 0 и z = £а; эта площадь зависит от параметра £:

Р (—to < 2 < щ) = Р (| z |< <ог)=2Ф (t)

Функцию Ф (£) называют интегралом вероятности, или инте­ гралом Гаусса; его легко рассчитать по формуле

 

t

f2

 

 

ф(‘>’ 7 1 г К

~ ' й

(Ы)

 

О

 

 

Значения Ф (г), рассчитанные по уравнению (1.4), приводятся

в справочных

таблицах..

 

 

Вероятность того, что случайная ошибка попадет за границы

интервала ± £ а ,

очевидно, равна:

 

 

Р ( И > « т ) = 1-2Ф (*)

Например, при £ = 2 величина Ф (£) = 0,4772, и Р ( |z| >• 2о) = = 0,0456, т. е. только в 4,56% измерений вероятна ошибка больше 2о. При £= 3 величина Ф (£) = 0,4986, и Р (| z |> За) = 0,0027. Поскольку эти вероятности очень малы, в реальных измерениях принимают, что ошибки больше 2а или За (в зависимости от требуемой надежности) невозможны. Тогда их называют предель­ ными ошибками. Таким образом, результаты измерений позво­ ляют найти так называемый доверительный интервал ± £ а , в ко­ тором с заданной вероятностью находится истинное значение измеряемой величины.

Итак, поскольку результаты измерения являются случайными величинами, их необходимо охарактеризовать (при выполнении нормального заксра ошибок) величинами р, и а. Отметим, что значения р, и а могут быть найдены из эксперимента, если число измерений очень велико, что оговорено условием п -*■ оо. При ог­ раниченном числе измерений (т. е. при так называемой ограничен­ ной выборке данных) получают не значения р, и а, а только их оценки: выборочное среднее значение измеряемой величины х

ивыборочную дисперсию s2. Если условие

П

S * i

г=1

а:=——

13

достаточно очевидно, то определение s2 по результатам экспери­

мента требует специального

рассмотрения.

 

Пусть ошибка z измерена

п раз и вероятность (частота) по-

явления ошибки z; равна р (

П

 

(так что

= !)♦ Тогда среднее

_

/-1

 

квадратичное значение z2 можно рассчитать по очевидному соотношению

 

 

я

 

 

 

 

1=1

 

(1.5)

 

 

 

 

Применяя выражение (1.5) для п -> оо и нормального закона

распределения,

получим:

 

 

 

 

Z2 =

 

dz

 

С учетом (1.1)

имеем *:

 

 

 

 

 

ОО

Z 2

 

 

 

 

 

 

 

 

2<J* dz = o*

(1.6)

—ОО

Условие

2 * ?

а2 =2*2= — ----

п

не может быть использовано экспериментатором, так как для определения zf нужно знать не только результат эксперимента xt, но и истинное значение измеряемой величины.

Если заменить zt = ц—xt экспериментально найденным значе­ нием zi3 — x—xt, то z3 будет также распределено нормально,

идисперсия распределения z3 может служить оценкой дисперсии z. При расчете дисперсии гэ следует учесть, что одно из измерений

не является независимым, так как был проведен расчет среднего

* При

выводе соотношения, (1.6) использован

метод

интегрирования

по частям,

а также интеграл Пуассона

j e~r* dr =

Vn.

Подставив г2 —

— fa/2a2, найдем

- С О

 

 

 

 

 

 

 

ОО

 

 

 

 

J r2e~r* dr2

 

-О О

■со

 

 

Далее интегрируем по частям.

14

значения. Таким образом, задав п— 1 значение zt э, можем полу-

П

ЧИХЬ Zn э из

условия

2 Zt Э — 0 *.

 

Поэтому

оценкой

i»l

является

величина

дисперсии

 

 

2

(* *)a

 

 

 

S2 = _t=l______

(1.7)

 

 

 

п — 1

 

Квадратный корень из s2 характеризует так называемую средне­ квадратичную погрешность единичного измерения:

2 (* з)2 -1 / 2

/

Зная s, можно оценить погрешность каждого единичного изме­ рения. Для заданной вероятности р доверительный интервал

истинного значения измеряемой величины ц

лежит в пределах

от Xi~ts до Xi + ts, где t = £ (р).

 

Разумеется, погрешность всех измерений

выборки меньше,

чем каждого единичного измерения. Для оценки погрешности сред­ ней величины сравним выборочную дисперсию для серии опытов и для единичного измерения.

Из определения z2 следует, что

2 zt

 

*2=

=

4 2

4 2

№ - * ) + ( * - * !) ] * =

 

 

п

t»i

i=i

п

п

\

 

 

 

г

 

 

 

 

( nz2+ 2z

2

* * + 2

zt

i

 

 

i=l

\

X=1

1=1

J

 

где

z характеризует

дисперсию среднего

значения,

так как z —

=

ji—х.

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку 2 zx = 0, то

/=1

п

э = й + 4 - 21-*г<

* Это условие получают следующим образом: поскольку zf- э = хxt, то

 

п

2

zi ) = ПХ — 2 Xi — п

1=1

/=1

15

С учетом

(1.7)

получим:

 

 

 

 

 

«— «л

71 “ 1

 

 

 

 

22=^3+------- г $2

(1.8)

 

 

 

1

Л

Применив

(1.8)

к

среднему

значению, найдем:

 

 

 

_

га— 1

 

 

 

 

Z“=Za = 22-» -------- S2

 

Так как

z8

sa

и, кроме

того, z2 я» s|,

то

С учетом (1.7) получим:

л

2 £ - * / ) *

Таким образом, для заданной вероятности р доверительный интервал истинной величины, определяемый для всей выборки, лежит в пределах от x - t s - до х + ts~.

При небольшом числе независимых опытов п применение за­ кона Гаусса дает слишком оптимистичные оценки. Это связано

стем, что при малых п значение х может сильно отличаться от р.

Втех случаях, когда нет уверенности в симметричном располо­ жении результатов опытов относительно р, пользуются оценкой доверительного интервала по Стьюденту. Эту оценку получают следующим образом.

Выразим ошибку определения среднего арифметического зна­ чения zc = р —х в единицах s-. Пусть tс = zc/s-, где £с*— отно­

шение двух случайных величин и само является случайной вели­ чиной. Отличие tc от { [последнее определено соотношением (1.2)]

в том, что ic характеризует

ошибку средней величины, a

t

единичного измерения.

 

 

 

 

 

 

 

 

Можно показать, что вероятность появления величины tc за­

дается не

формулой (1.3),

д

соотношением

 

 

 

 

 

 

 

Р (tc)

 

 

Г (у/2)

 

 

 

 

(1.9)

 

 

 

 

 

 

 

 

 

 

 

 

 

/ л

/ v

Г (v/2) ( l + ^/v)

8

 

 

 

и зависит от числа степеней

свободы

v =

п 1, т. е.

от

числа

опытов *.

Распределение

 

tc

совпадает

с нормальным

законом

распределения при v

оо и отличается от него при малых v.

Для

небольшого числа

опытов доверительный

интервал

лежит

*

В

этом

соотношении

Г — гамма-функция.

Г (а -ф- 1) =

а Г (а);

аГ (а -ф- 1) = а !

для целых

а; Г (1/2) = V п.

 

 

 

 

16

в пределах от ж—Zcs- до х + tcs^. Например, в случае , проведения четырех опытов при вероятности 95% , значение tc — 4,3, что расширяет ширину интервала ± ts - почти в два раза по сравне­ нию с расчетом, где используется распределение Гаусса (t = 2,3).

Кроме

того, величина

tc

особенно существенно

уменьшается

при переходе

от

трех

опытов

к четырем: tc (2;

0,95) = 12,7,

tc (3;

0,95) =

4,3,

т. е.

имеет

смысл повторять параллельные

измерения 4 раза.

 

 

 

 

 

2. ОПРЕДЕЛЕНИЕ ОШИБОК РАСЧЕТА СЛОЖНОЙ ВЕЛИЧИНЫ

Пусть цель эксперимента — определение сложной величины у, для которой задано уравнение

У — f (Рт? •■

Рр)

(1.10)

В ходе эксперимента значения Цц

...,

[хр определяют с ошибками

и для них известны оценки х х,

хр и стандартные отклонения

s - , ..., s—. Чтобы получить оценку у величины у,

пользуются

* р

•соотношением:

у —/ (®1» • • •» хр)

•а оценка дисперсии величины уs- может быть получена следу­

ющим образом. Обозначив отклонения средней величины ж,- от ц/ через zit разложим функцию (1.10) в ряд Тейлора,'ограничииаясь первыми степенями отклонений zt:

 

 

 

/

({lx, . .

. ,

р р ) = /

(Xx +

Zj, . .

Xp + Zp) =

 

 

 

 

 

 

 

 

 

(Xx«

• « ч

Xp)

 

d / (Xx i . .

. , Xp)

~

(U l)

: / (x x »

• •

•» Xp) ■

 

 

fy l

 

Z x + . . . ■

 

д ц р

 

 

ip

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из

(1.11) найдем среднюю величину z2 (черта сверху

означает

•среднюю

величину):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22

[/ (Pi,

. .

Цр)

/ (Хх, . •

Хр))2 —

 

 

 

 

 

____ Г

(хх> ••*» Хр)

-*

 

(Хх)

. * .)

Хр) ..

Т -

 

 

-

[

 

 

9рх

 

 

zl +

* • ••+

р

Zp

 

 

 

 

 

 

 

 

 

 

 

 

 

_

Г

ft/ (Хх,

. . . 1 хр)

 

 

. Г д/ (Хх, .

. .,

Хр)

 

 

 

 

L

 

 

Фг

 

J

 

*

, + L

5рр

 

J

ZP

 

Переходя к выборочным дисперсиям, получим:

 

 

 

 

о

Г

*/(*1>

•••• х р )

"I2 с2

.

, Г df(x1. .

• . . Хр) I 2

2

 

sj = L —

 

5 ^ —

 

J

* + • • - + L —

щгр

 

J

%

(1Л2)

17

При выводе уравнения (1.12) сделан ряд допущений. Одно из TTHY предполагает возможность пренебрежения членами, в которые

входят парные произведения zx, z2,

(из-за симметрии кривых

распределения zx, z2, ...), а также производными высших порядков. Поэтому соотношение (1.12) не является строгим. Как будет пока­ зано ниже, строго оценка дисперсии величины у может быть получена только для линейной зависимости (1.10). Однако исполь­ зование уравнения (1.12) оказывается полезным при выборе метода определения сложной величины.

Пусть, например, константу скорости к рассчитывают по уравнению

где %— время, х — степень превращения; ошибка измерения т близка к нулю, а ошибка определения х охарактеризована вели­ чиной s—. В соответствии с (1.12) получим:

 

sH

1

1

S -

Sk

-----------—

 

х

1—X

*

Чем больше х, тем больше

следовательно,

большую точность,

дают измерения, полученные в начале процесса. Это справедливо, однако, если s- не меняется во всей области измерений х.

Рассмотрим теперь ошибку расчета энергий активации Е . Если;

вести расчет по уравнению

Я1п -|-

Е——--------1---= const In fc2 — const In fei

~n ~ 1 7

то при точном измерении T

Если считать, что отношение s-^/k

постоянно (оно

характеризует

относительную ошибку),

то

 

 

 

 

S-

 

S—

V 2

s'k

s_=const V 2

k

и

Е _

Е

к

 

Е

In (ft3//ct)

к

Проводя расчеты по последнему соотношению, легко найти, что при к2/кх, равном 2,0; 1,5; 1,25, значения s^jE равны соответ­ ственно 2{Skfk)', 3{Sbjk)’, 6 (sh//c). Очевидно, что относительная ошибка определения энергии активации в несколько раз больше относительной ошибки определения констант скоростей.

18

3. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ ПРИ ОБОСНОВАНИИ ВЫВОДОВ ИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИИ

Статистическая оценка выводов из экспериментальных иссле­ дований наиболее полезна, по-видимому, в следующих двух слу­ чаях: 1) при сравнении результатов двух серий опытов — «ста­ рой» и «новой», если «новая» проведена в измененных условиях; 2) при определении, какому теоретическому соотношению из не­ скольких возможных (иными словами, какой теории) лучше соот­ ветствуют экспериментальные данные.

В первом случае используют подход Фишера, который пред­ ложил рассмотреть гипотезу о том, что результаты серий опытов Ху и х 2 статистически неразличимы и что математическое ожидание

величины у =

х хх 2 = 0. Предварительно необходимо

опреде­

лить дисперсии выборок s|t и

и выяснить,

различимы ли они

(статистически.

Фишер ввел

для этого

функцию F 3 —

причем Ху и х 2 выбраны так,

чтобы F 3

0)

и

определил при

°xi ~ af, закон ее распределения *. При

этом

условии

отноше­

ние

дисперсий

становится так

называемым

критерием

Фишера

F =

F (р, vx, v2), зависящим от заданной вероятности р

и чисел

независимых опытов в обеих выборках v x и v2. С заданной вероят­

ностью р дисперсии измерений равны, если F 3 ^ F (р, v lf v2),

и различны, если F 3 >» F (р,

vx, v 2).

В случае, когда

целесообразно объединить выборки

и найти оценку дисперсии измерений по очевидному соотношению

2

Zi)2 + S (*ia— х ъ)*

S2= i=1

t=l

 

л2—2

В знаменателе учтено, что два опыта «израсходованы» на опреде­ ление средних значений.

Поскольку

 

 

 

* 2 - si

+ s i =

X

 

У

х2

пх

 

ТО

 

 

 

У

_ ***1

1 F

*г1п2

£с•э — S -

s-

У

пх+ пг

У

Величина tc распределена по закону

(1.9) с вероятностью р

и числом степеней свободы v = я 1 + ге2 — 2. Если fc< 3 ^> tc {р, v), то у Ф 0, и Ху и х 2 статистически различимы; при tc> э ^ tc (р, v) различие в результатах двух серий отсутствует.

* Вывод приведен в литературе [1, 2].

19

В случав, когда а|

Ф а-. , оказывается возможным [1, 2]

Х\

Xj

сохранить ту же последовательность расчета, определяя, однако,, v по соотношению

О

s. S -

X t Х2

V= (»l + «2—2)

Отметим, что использование подхода Фишера удобно и для отсеивания ошибочных результатов, если, например, в массиврезультатов попадают резко отличающиеся значения. В этом случае, разделив весь массив на два массива (хг — характерные результаты и х 2 — выпадающие результаты), можно проверить,, являются ли они частями единой выборки, т. е. выполняется ли

условие

/а£ << F. Если это условие, не выполняется, второй

массив не характеризует результаты исследований и может быть отброшен.

Прй проверке теоретических соотношений можно использовать, тот же подход, заменив дисперсии измерений дисперсиями

воспроизводимости Sp. Так, если задано соотношение для расчета величины у и по нему рассчитаны для 'всех п измерений значе­ ния yip, то

П

2 (уip— Vi э)2

2__^1___________

sp

п —к

где У'1Ъ — экспериментальное значение у в г-том опыте, к — число* опытов, использованное для определения неизвестных коэффици­ ентов теоретического уравнения. Сравнение расчетных дисперсий, найденных по различным уравнениям, с помощью критерия Фи­ шера позволит выбрать наиболее точное уравнение (с наимень­ шим значением sj;).

Часто ту же задачу решают, применяя так называемый крите­

рий Кохрена. При ah = a h = ... = а\т Кохрен нашел закон распределения для дисперсионного отношения

+2+ * * ’ + <уут

имеющего число степеней свободы v = п — 1. Величина G зависит от выбранной вероятности р, а также от v и т, т. е. G = G (р, v, т)>

Сравнивая экспериментальное значение

•I

G3—

+ S?

У1

20

Соседние файлы в папке книги