Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методы оптимизации эксперимента в химической технологии

..pdf
Скачиваний:
39
Добавлен:
15.11.2022
Размер:
13.27 Mб
Скачать

= э э — ►

Частная

модель

Рис. 27. Схема МГУА

или второго порядка

v = Ь0+ bxXi + Ь2х2+ ^12*1*2 + Ьг1х^ + Ь22*^.

(IV. 124)

Последовательно образуя, согласно схеме на рис. 27, новые пере­ менные, стараются в конце концов получить расчетные значения у, являющиеся хорошей аппроксимацией экспериментальных данных. Пусть исходные экспериментальные данные представлены в табл. 26. Разобьем совокупность экспериментальных данных на три множества:

обучающее м 0 = {

у?) ,

» =

1 , 2 , . . . , лг;

проверочное

Af„ = {

yj},

i = пг+

l , пг +

2, . . , пг\

контрольное

-Мк ={•*?•

4^).

*' =

«г +

1. «г +

2, ... , л.

На первом этапе (рис. 27)

построим С* частных полиномов для

двух факторов хи и xjt например, вида (IV 124):

 

 

®и) и] 4"

bjXj -(- bujXuXj -4" buux^ + b j i x j :

 

и, /=

1,

2, ...» k\

и =/= j .

 

Коэффициенты частных полиномов определим методом наименьших квадратов по данным табл. 26, принадлежащим обучающему мно­ жеству M0>v при этом число точек в множестве т должно быть больше числа. коэффициентов в частном полиноме. При определе­ нии каждого частного полинома на первой стадии (рис. 27) мини­ мизируется сумма квадратов отклонений вида

Г

А

(IV. 125)

* i= 2 l« /l -<W (‘>J •

i= l

Среди полученных полиномов необходимо выбрать лучшие. Исполь­ зуем для этой цели проверочное множество экспериментальных точек Мп. Вычислим vuj для каждого полинома во всех точках множества Мп и определим средние квадратичные ошибки аппрок­ симации экспериментальных данных проверочного множества Мп каждым частным полиномом:

su}

 

[уi vuj (OP;

(IV. 126)

 

 

 

у ^

Ж

 

 

tit j 1» 2, . . . t

и ф /.

 

Среди ошибок аппроксимации найдем наименьшую и обозначим ее

.s*,. Выберем среди частных полиномов т\ лучших (vv v2,...,vj, кото­ рым соответствуют меньшие ошибки аппроксимации sUJ. В методе группового учета аргументов процедура выбора числа лучших поли­ номов наименее формализована. Чрезмерное уменьшение числа отбираемых на следующую стадию полиномов может привести к потере значимых факторов, увеличение т к резкому росту объема вычислений.

Вычислим значения vj(i), j=1,2,...,mi отобранных полиномов во всех точках обучающего множества Мо и контрольного Мх. Полученные значения Uj(i) на контрольном множестве Mt используем для опреде­ ления средних квадратических ошибок 5j :

 

bJ=

 

 

 

 

(IV. 127)

Среди

всех величин

5,

найдем

наименьшую

и обозначим ее

.

Эта величина используется на следующих стадиях аппроксима­

ции.

второй стадии

 

отобранные

полиномы

vv

служат

На

 

аргументами новых частных полиномов:

 

 

 

zuJ = bQUj +

buvu + bjvj + buJvuVj + buux%.+ bjjv2] ;

(IV. 128)

 

u, / = 1 , 2 , . . . , %; и=£/.

 

 

Число полиномов (IV 128) на второй стадии равно СД. Коэффициенты новых частных полиномов определяются методом

наименьших квадратов на обучающем множестве Л/0, значения vj(i) и vu(i),j, и 1, 2,..., т, ;у т4и\ / —1, 2,..., л, были вычислены на первой ста­ дии. При определении коэффициентов полиномов (IV.128) минимизиру­ ется сумма квадратов отклонений вида

2* г

Л 1»

(IV. 129)

Ф *=

i=l

Для выборки лучших полиномов воспользуемся проверочным множе­ ством точек Мп. Вычислим zuj для каждого нового частного полинома во всех точках множества Мп и определим средние квадратичные ошибки аппроксимации экспериментальных данных проверочного мно­ жества Мп, подставив для этого в формулу (IV.129) zuj вместо щ . Среди ошибок аппроксимации снова найдем наименьшую и обозначим ее s*2. Выберем среди новых частных полиномов т2 лучшие zu z2, ..., zm^ которым соответствуют меньшие ошибки аппроксимации эксперимен­

тальных точёк на множестве Мп. Число отобранных полиномов m2 меньше отобранных на первой стадии отбора m2 < СД. Каждый такой полином представляет собой зависимость уже от четырех факторов, поэтому вероятность аппроксимации им с требуемой точностью эксперименталь­ ных данных табл. 26 выше, чем полиномами, полученными на первой стадии. В связи с этим необходимо выяснить целесообразность перехода к третьей стадии аппроксимации. Процедура последовательной аппрок­ симации оканчивается, когда средняя квадратичная ошибка аппроксима­ ции экспериментальных данных контрольного множества Мх лучшим полиномом 5* статистически незначимо отличается от ошибки воспроиз­ водимости. Для проверки точности аппроксимации вычислим средние квадратичные ошибки 5j на множестве Мх:

,

/ =

1. 2, ... , щ . (IV .130)

Найдем наименьшую среди всех 5j и обозначим

5*2 .

Если окажется, что 6*2 статистически

незначимо отличается от

ошибки воспроизводимости, то процедура аппроксимации закончена. Если же 5*2 существенно больше ошибки воспроизводимости, необхо­ дима третья стадия аппроксимации, на которой уже в качестве фиктив­ ных аргументов будут использоваться полиномы zv z2, ..., zmi.

При отсутствии информации об ошибке воспроизводимости для окон­

чания процесса аппроксимации можно применять величину

 

е = I Ь*1 — &*2 I / ^*2•

(IV .131)

Если е относительно невелико, например менее 0,1-0,15, то дальней­ шая аппроксимация малоэффективна.

Следует отметить, что во многих случаях величина 5* возрастает с ростом числа стадий аппроксимации. Это явление называют неустой­ чивостью МГУА. Неустойчивость МГУА проявляется и в изменении величины s\ которая с ростом числа стадий вначале убывает, а затем начинает быстро возрастать. Величина s* менее чувствительна к росту числа стадий, чем 5*, так как точки, принадлежащие проверочному множеству Мп, участвуют в формировании аппроксимирующего поли­ нома. Рекомендуется заканчивать процедуру последовательной аппрок­ симации на стадии, соответствующей минимальному значению s*.

Многие вопросы применения и обоснования метода группового учета аргументов еще нуждаются в детальной разработке. Важным достоин­ ством этого метода является возможность на каждой стадии аппрокси­ мации иметь дело с информационной матрицей порядка, не превышаю­ щего 6X 6, что в общем случае способствует улучшению ее обусловлен­ ности.

12. Метод главных компонент. Метод главных компонент был пред­ ложен Пирсоном (1901) и позднее детально разработан Хотеллингом (1933). Метод дает возможность от непосредственно измеряемых фак­ торов *|(7 —1, ..., к) перейти к их некоррелированным линейным ком­ бинациям:

k

Vj = ^ ^ i x i » i » j ~~ 1» 2 , . . . i ky

(IV. 132)

i=l

 

дисперсии которых убывают, т. е.

sb > s*a> >si,

Коэффициентами линейных комбинаций, нагрузками /-й переменной в j компоненте щ являются элементы собственных векторов матрицы ковариаций, а дисперсии компонент равны собственным числам этой матрицы.

Пусть X матрица центрированных наблюдений с нулевым вектором

средних:

 

 

/ *11

*21 • • *Ы\

 

 

 

 

 

 

 

 

 

 

/ Х12

*22 • • • *Ь2 \

 

 

 

 

 

 

\хщ

 

 

;

 

 

 

 

 

 

*271 • •

хкп/

 

 

 

Тогда матрица

N

 

N

 

 

 

 

 

 

 

 

 

xiix2i *• •

2

 

 

 

2

£

2

 

 

 

 

i=l

 

i=l

 

N

i=i

 

L = Хтх

 

N

 

N

 

 

 

 

( п - I)-1

2

li

2

 

**!•••

2 J X2ixhi

(IV. 133)

п— 1

 

<=1

 

i=l

 

i=

1

 

 

 

N

 

N

 

xhiXti ...

N

 

 

 

^ 1=1

 

2

1

2

 

 

 

 

1=

 

 

f=l

 

дисперсионно-ковариационная матрица наблюдений: ее диагональные элементы представляют собой дисперсии, недиагональные элементы — ковариации.

Если от центрированных переменных перейти к нормированным (см. IV.93), получим корреляционную матрицу:

 

 

гхгх%

rxxxk

 

R =

' Х гХ х

 

***h

(IV. 134)

 

 

 

 

 

tkxx

...

1

 

 

ЛЪГ*

 

 

Для любой симметрической матрицы L (илиR) существует ортогональ­ ная матрица С/, такая, что

Хх

о

о

 

и Т LU = Х = О

Х2

о

(IV. 135)

\0

о

*h,

 

где кг (/*=1, 2, /г)—собственные значения матрицы L, a U является такой ортогональной матрицей, в которой г-й столбец является r-м соб­ ственным вектором, соответствующим г-му собственному числу. Соб­

U j i V f
(IV. 139)

ственные числа матрицы L определяются как корни характеристического многочлена

(L \Е) = О,

(IV. 136)

где is —единичная матрица;

| L— Х£ j =* (—- 1)ЛХЛ+ ( - 1)Л-1ЛХ*-* + . . . + Рк.

(IVЛ37)

Первый, второй и последний члены -характеристического полинома матрицы L определяются просто: р\ = tv(L) след матрицы L (сумма ее диагональных элементов); Pk = \L\. Значительно трудней определить остальные члены характеристического полинома. Предложены следую­ щие формулы для коэффициентов характеристического полинома:

Li = L

Pi =

tr (Lx)

Bx LxpxE

L2 — LBX

p2=

tr (L2)

B2

L2 ^2^

 

 

 

 

(IV. 138)

Lh-i LBh- 2

Ph-i =

_ j tr (Lfe-x)

£fc-i =

Lfc-x —

Lh =

рл = —

tr (Lfc)

Bk = Lk — pkE

где £ —единичная матрица.

Геометрически нахождение главных компонент сводится к переходу к новой ортогональной системе координат. Первую координатную ось определяют так, чтобы соответствующая ей линейная комбинация из­ влекала возможно большую дисперсию, далее находят ортогональную ей ось, которая делает то же самое с оставшейся дисперсией, и т. д. От новых координат Vj можно вернуться к старым х,-:

k

*/= 2 , it /= 1, 2........ k,

/= 1

где V j —j - я главная компонента; ии —массаj-и компоненты в /-и пере­ менной.

Доля дисперсии, выраженная в %, объясняемая r-й компонентой, определяется следующим образом:

7

Хг

100%.

(IV. 140)

= — г1----

ЦХ,

В ряде задач интересные выводы можно получить по небольшому числу компонент. В этих случаях метод главных компонент дает воз­ можность уменьшить размерность задачи за счет того, что линейные комбинации, имеющие маленькие дисперсии, отбрасываются, а рас­ сматриваются лишь линейные комбинации с большими дисперсиями.

Например, процесс характеризуется не одной выходной величиной, а целым набором коррелированных показателей. Желательно знать, какие

комбинации показателей объясняют большую долю дисперсии. Это определит, что следует изучать дальше. Главные компоненты можно рассматривать как новое множество измерений, полученных в результа­ те линейной комбинации исходных измерений. Используя метод глав­ ных компонент, можно попытаться свести большое количество сильно коррелированных характеристик процесса к одной-двум обобщенным характеристикам или компонентам, что облегчит оценку качества про­ цесса в каждой точке наблюдения. Все это будет иметь смысл только в том случае, если полученным линейным комбинациям удастся дать разумное физическое истолкование.

Метод главных компонент применяют и как способ ортогонализации матрицы независимых переменных. Если К—матрица значений главных компонент, полученная ортогональным преобразованием:

V = X U ,

(IV. 141)

то новые переменные vj независимы и их ковариационная матрица диагональна;

VT V = U TXr X U = (n— l)UTLU.

(IV. 142)

С учетом (IV.135) имеем

 

Кг К=(л-1)Х.

' (IV. 143)

Если Y —вектор значений выходной величины и все предпосылки регрессионного анализа выполняются, можно получить оценки коэффи­ циентов линейного уравнения регрессии

У = VB,

(IV. 144)

где В вектор коэффициентов.

 

В соответствии с (fv.l43) получим

 

В = (п — 1)-1L“1KK,

(IV. 145)

или для каждого коэффициента

 

^ = („ - i ) V 2 J щт

(IV. 146)

f=l

 

оценка значимости коэффициентов регрессии по главным компонентам проводится по меритерию Стьюдента вполне корректно, так как все ковариации между коэффициентами равны нулю:

I bj 1

 

1bj\

(IV. 147)

 

 

 

S b j

Y \ n

1)

SBOCnp

Можно показать, что коэффициенты регрессий по независимым пере­ менным х и по главным компонентам связываются следующим обра­

зом:

к

Ъ} = 2

(IV. 148)

t=l

 

где Д/ коэффициент регрессии по переменной x if / —1, 2,

к\ bj

коэффициент регрессии по компоненте Vj; ии координаты у-го собствен­ ного вектора; /, —масштабный множитель.

Главные компоненты не инвариантны к изменению масштаба тех шкал, по которым отсчитываются переменные. Обычно работают с

нормированными переменными, в качестве масштабного множителя берут величину, обратную среднему квадратичному отклонению /, —

т. е. все вычисления проводятся для матрицы корреляции.

1Йетод главных компонент был успешно применен для построения математической модели промышленного процесса флотации калийных РУД в условиях комбината Белорускалий. В ходе пассивного экспери­ мента на комбинате фиксировались значения 20 входных и двух выход­ ных параметров процесса. Были построены уравнения регрессии по главным компонентам для показателей процесса у } и у2, проведена оценка значимости коэффициентов по формуле (IV.147). По уравнениям регрессии и по нагрузкам компонент оценена степень влияния перемен­ ных на показатели процесса у, и у2, сделаны выводы о взаимосвязях процесса и даны рекомендации по его улучшению.

Глава посвящена методам корреляционного и регрессионного анали­ зов, широко применяемым при обработке результатов наблюдений.

Математическая модель процесса представляется полиномом, коэф­ фициенты которого определяются методом наименьших квадратов.

Метод наименьших квадратов обосновывается как частный случай метода максимального правдоподобия при нормальном распределении наблюдаемой случайной величины.

Полиномиальная модель очень удобна, так как позволяет улучшать аппроксимацию, повышая порядок полинома, приводит к линейной сис­ теме нормальных уравнений при определении коэффициентов уравнения регрессии методом наименьших квадратов.

Рассмотрены различные алгоритмы регрессионного анализа для обра­ ботки пассивного эксперимента.

Корреляция между коэффициентами уравнения регрессии, получен­ ного обработкой пассивного эксперимента, затрудняет статистический анализ и интерпретацию результатов. Методы активного эксперимента, изложенные в следующей главе, дают возможность преодолеть эти недостатки классического регрессионного анализа.

Упражнения

1. В таблице приведены характеристики гомогенных анионитовых мембран, полу­ ченные при различных условиях нитрования сополимера: х\ температура, °С; Х2 —про­ должительность, ч; хз —степень нитрования, %; у\ —удельное объемное электрическое сопротивление, Ом • см; у2 предел прочности при растяжении, МПа.

Номер

XI

ха

 

хз

ух 10

У2 • 10

Номер

XI

ха

хз

ух • 10

У7 • 10

опыта

 

 

 

 

 

 

 

 

 

 

 

 

опыта

 

 

 

 

 

1

60

2

 

30

920

190

9

70

8

85

85

59

2

60

4

 

55

290

105

10

70

10

85

89

53

3

60

6

 

74

190

74

11

80

2

55

505

80

4

60

8

 

75

100

68

12

80

4

80

195

68

5

60

10

 

75

100

68

13

80

6

92

82

54

6

70

2

 

40

740

107

14

80

8

92

82

50

7

70

4

 

68

207

72

15

80

10

92

88

50

8

70

6

1

S3

98

59

 

 

 

 

1

 

Определить коэффициенты парной и частной корреляции между параметрами процесса.

2.Определить зависимость содержания Fe, % (у), в кристаллах медного купороса

CuS04 • 5 Н2О от содержания

FeS04,

г/л (*),

в маточном растворе. Каждый опыт повто­

ряется два раза.

 

 

 

 

 

X

У

 

X

 

У

50

0,65

0,84

85

1,33

1,47

60

0,96

0,84

100

1,75

1,86

70

0,93

1,2

105

2,32

2,48

а) Оценить однородность дисперсий; б) определить дисперсию воспроизводимости; в) выбрать вид функциональной зависимости y^f(x)\ г) определить уравнение регрессии; д) провести регрессионный и корреляционный анализ результатов.

3. Определить зависимость гидравлического сопротивления слоя насадки Ар (Л —4 м, насадка кольца Рашига 15X15X0,5 мм) от фиктивной скорости потока иСр, используя ортогональные полиномы Чебышева:

VcP , см/ с .

.

1

2

3

4

5

6

7

8

9

10

Ар • 10, МПа .

.0,01

 

0,025

0,04

0,055

0,07

0,09

 

0,113

0,13

0,16 0,019

4. При получении фосфора возгонкой из фосфатов кальция исследовалась зависи­ мость степени восстановления фосфата (у) от температуры (х) для фосфорита Каратау. Опыты повторялись 2—3 раза.

*, °С

 

у. %

 

х, °С

 

у» %

 

1100

8,5

11,6

21,8

1175

37,5

40,0

42,3

1125

19,0

28,2

1200

50,5

50,0

 

1150

29,5

30,6

 

1225

57,2

60,3

62,7

а) Проверить однородность выборочных дисперсий; б) посчитать коэффициент кор­ реляции между температурой и степенью восстановления; в) определить коэффициенты уравнения регрессии; г) оценить значимость коэффициентов и адекватность уравнения регрессии эксперименту.

5) Исследовалась зависимость степени окисления (у) хромита СГ2О3 в хромат СгОз от продолжительности прокаливания (х) шихты при 830°С. Каждый опыт повторялся два раза.

х, ч

 

у. %

х, ч

 

у. %

0,3

8,2

12,3

3,0

49,3

51,4

1,2

28,0

32,0

4,0

52,0

58,0

2,0

43,1

47,2

5,0

56,5

57,4

 

 

1

6,0

58,7

61,6

Считая зависимость степени окисления от времени нелинейной (полином второго порядка), методами линейной алгебры определить уравнение регрессии и провести регрессионный и корреляционный анализ результатов.

часть 2

Методы

 

планирования

 

эксперимента

Г Л А В А V

МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСТРЕМАЛЬНЫХ ЭКСПЕРИМЕНТОВ

Большое количество экспериментальных задач в химии и химической технологии формулируется как задачи экстремальные: определение оптимальных условий процесса, оптимального состава композиции и т. д. Благодаря оптимальному расположению точек в факторном простран­ стве и линейному преобразованию координат, удается преодолеть не­ достатки классического регрессионного анализа, в частности корреляцию между коэффициентами уравнения регрессии. Выбор плана эксперимента определяется постановкой задачи исследования и особенностями объек­ та. Процесс исследования обычно разбивается на отдельные этапы. Информация, полученная после каждого этапа, определяет дальнейшую стратегию эксперимента. Таким образом возникает возможность опти­ мального управления экспериментом. Планирование эксперимента позволяет варьировать одновременно все факторы и получать коли­ чественные оценки основных эффектов и эффектов взаимодействия. Интересующие исследователя эффекты определяются с меньшей ошиб­ кой, чем при традиционных методах исследования. В конечном счете применение методов планирования значительно повышает эффектив­ ность эксперимента.

1. Полный факторный эксперимент. При планировании по схеме полного факторного эксперимента (ПФЭ) реализуются все возможные комбинации факторов на всех выбранных для исследования уровнях. Необходимое количество опытов N при ПФЭ определяется по формуле

N = nk,

где п—количество уровней; к число факторов.

Если эксперименты проводятся только на двух уровнях, при двух значениях факторов и при этом в процессе эксперимента осуществляются все возможные комбинации из к факторов, то постановка опытов по такому плану называется полным факторным экспериментом типа 2к. Уровни факторов представляют собой границы исследуемой области по данному технологическому параметру. Например, изучается влияние на выход продукта (у, %) трех факторов: температуры (zi) в диапазоне 100—200°С, давления (z^) 2 - 6- 10 5 Па и времени пребывания (Zg) 10—

20 мин. Верхний уровень по температуре z1max равен 200°С, нижнИЙ zj1"" равен 100°С. Тогда для z1имеем

 

+ ^ ,п

-min

 

= 50°.

2х =

= 150°; Дгх =

 

 

Вообще для любого фактора z}

о

min

; + z]

4 я

 

. 1=1, 2. .... .

k;

.max -min

7~~cl

2

(V-l)

(V.2)

Точка с координатами (z°u ..., zj) называется центром плана, иногда ее называют основным уровнем; Дz j —интервал варьирования по оси Z j. От переменных z u ..., z k перейдем к новым —x ]t ..., х к путем следую­ щего линейного преобразования:

j = l , 2,

k.

(V.3)

bzj

 

 

Для переменных x v ..., х к верхний уровень равен -h 1, нижний уровень -1, координаты центра плана равны нулю и совпадают с началом коор­ динат. В рассматриваемом примере /г—3. Число возможных комбинаций N из трех факторов на двух уровнях равно 2* —23 —8. План прове­ дения экспериментов (матрица планирования) записывается в виде табл. 28.

Представленный в табл. 28 план в безразмерном масштабе геометри­ чески может быть интерпретирован в виде восьми вершин куба (рис. 28). Введем в ПФЭ 23 столбец так называемой фиктивной переменной

яз - 1 (табл. 29).

Приведенная в табл. 29 матрица планирования обладает следующими свойствами:

N

^

ДСц| Xji == Of

Ut

 

 

i

я

 

 

 

 

 

2

j — I *2» .

. *;

0;

<V.4)

N

 

1 ,

 

 

 

(=1

1 = 0,

• «1

 

 

 

 

 

 

 

где к — число независимых факторов; N — число опытов в матрице пла­ нирования.

Первое свойство (V.4) —равенство нулю скалярных произведений всех вектор-столбцов —называется свойством о р то го н а льн о с ти матрицы пла­ нирования. Это свойство резко уменьшает трудности, связанные с рас­ четом кфэффициентов уравнения регрессии, так как матрица коэффи­ циентов нормальных уравнений (Х ТХ ) становится диагональной и ее