Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование эксперимента при поиске оптимальных условий

..pdf
Скачиваний:
35
Добавлен:
15.11.2022
Размер:
11.27 Mб
Скачать

 

 

 

 

 

 

95,0"

Y rY -

B rXTY = [95,0 90,0 85,0 82,0].

90.0

85.0

 

 

 

 

 

 

 

 

 

 

 

 

82.0

 

 

1

1

1

1

95~|

 

 

 

— [88,0—2,0—4,5]

1

1 — 1 1

 

 

 

1 — 1

 

1 1

82_

 

 

 

 

 

 

Здесь мы

встретились с

необходимостью перемножить три мат­

рицы. Эту операцию можно выполнять либо справа налево, либо слева направо. Сначала перемножается первая пара матриц. А затем матрица-произведение рассматривается как новая мат­ рица и перемножается с третьей. Конечно, размеры всех матриц должны удовлетворять условиям существования произведения, что и выполняется в нашем случае.

Кроме статистических оценок, уже знакомых по предыдущей главе, введем еще одну оценку — оценку дисперсии предсказан­ ного значения отклика. Если имеется адекватное уравнение ре­ грессии, то его можно использовать для предсказания результата какого-нибудь нового опыта в некоторой точке факторного про­ странства. Для этого достаточно подставить в уравнение коорди­ наты этой точки и произвести алгебраические операции. Очевидно точность такого предсказания будет неодинакова в разных точках факторного пространства. Чтобы учесть это различие и вводится дисперсия предсказанного значения отклика.

Пусть известное уравнение имеет вид у=Ъ0-\-Ъ1х1. Координаты предсказываемой точки задаются вектором ХТ=[1 хJ . Отсюда

следует,

что

 

Ьо

& =

[1 х<\ I V

В рамках предпосылок регрессионного анализа х — неслу­ чайная величина, а Ъ0 и Ъг — случайные величины, так как они являются функциями результатов эксперимента. Следовательно, у — тоже случайная величина, связанная с некоторой суммой двух величин Ъ0 и bv Дисперсии и" ковариация Ь0и Ьх уже из­ вестны. Они являются элементами матрицы дисперсий-кова­ риаций. Для определения дисперсии предсказанного значения отклика s2w можно воспользоваться законом сложения ошибок [9]. Если y = f(z i, z2, , zk), где — независимые случайные величины, входящие в известное уравнение, то

COV { Z J J z { ) .

/ - 1

J - 1 f - 1

 

1Ф1

170

В нашем случае

*«<> ~ Ш

s< ->+ Ш

s'“'+ ОШ!cov {Ь»’ bi)

или

 

 

shi) » Аы +

2xi соv {&о>

bi) + х\Аь,)

Последнее соотношение можно записать также в матричной форме:

^ () = X f(X TX)-1 sfy)Xi = [l *,]

S\bo)

_cov{60, Ьх}

COv{60, bj)" ' 1

«о* Со

1---

Давайте произведем вычисления для нескольких опытов из примера предыдущего параграфа. Возьмем в качестве первой точки начало координат — нулевой опыт. В этом случае вектор X. имеет вид Х^=[1 0 0 0 0 0 0 0]. Матрица

1/8

1/8

 

1/8

1/8

О

М- ^ ( X ’X sL j)-1 =

U

 

1/8

 

 

 

 

 

 

1/8

 

 

0

1/8

 

_

 

1/8_

так как

= 1 .

 

 

Отсюда получим дисперсию предсказанного значения у, ко­ торый в этой точке равен 23,5875

- 1 /8

 

- 1-

1 /8

0

0

 

1 /8

0

s\%} = 11 00 00 0 0 0]

1 /8

0

1 /8

0

 

 

1 /8

0

о

оо

1 /8

0

0

= [1/8 0 0 0 0 0 0 0]

1/8 = 0,125.

171

£ Таким образом, точность предсказания отклика в центре экс­ перимента оказалась равной дисперсии коэффициентов. Посмот­ рим, какое значение примет s2^ в точке с координатами, рав­ ными 2: Х^=[1 2 2 2 2 2 2 2]. Тогда

 

 

1/8

 

 

_ 1_

 

 

 

 

2

 

 

1/8

0

 

 

 

1/8

 

 

2

=

[1 2 2 2 2 2 2

1/8

 

 

2

2]

1/8

 

2

 

 

 

 

 

 

0

1/8

 

2

 

 

1/8

2

 

 

U

 

 

 

 

 

1/8___

2

=3,625.

Вэтой точке $9=20,0125, а дисперсия s2^ =3,625. Обратите вни­ мание, как существенно увеличилась дисперсия предсказания при удалении от центра.

Описывая статистический анализ, мы до сих пор не принимали во внимание повторных наблюдений. Перейдем теперь к рассмо­

трению этого вопроса.

10.5.Взвешенный метод наименьших квадратов

истатистический анализ

Каждый опыт несет некоторую информацию об объекте. Опыты, различающиеся условиями проведения, несут информацию об эффектах факторов, а параллельпые опыты позволяют оценить дисперсию воспроизводимости. С ростом числа параллельных опы­ тов растет точность эксперимента и оцениваемые эффекты можно определить с большей надежностью. На практике встречаются раз­ личные случаи дублирования опытов. Может оказаться, что к мо­ менту начала эксперимента воспроизводимость опытов известна по предыдущим исследованиям. Так бывает иногда в задачах анализа вещества, когда используется методика с заранее извест­ ной ошибкой воспроизводимости. Если предполагать, что в на­ мечаемой серии опытов ошибка не изменится и нет опасности появления грубых наблюдений, то параллельные опыты можно не ставить. Если же мы не располагаем такой информацией по предыдущим исследованиям или считаем наше предположение слишком жестким, тогда приходится дублировать опыты. Сделать это можно по-разному: в одной точке, в нескольких точках и во всех. В качестве одной точки выбирается центр плана или неко­ торая строка матрицы. В других случаях бывает равное число параллельных (равномерное дублирование) или различное (не­ равномерное дублирование). Последнее часто имеет место потому,

172

что часть опытов может оказаться потерянной: не удался анализ, сломалась установка и т. д. Различные варианты дублирования опытов приводят к различным вариантам обработки данных.

Начнем

с наиболее

распространенного случая — равномерное

дублирование. Если при записи матрицы X не делать различия

между параллельными

и различными опытами, то число строк

в матрице

будет равно

Nn, где N — число различных опытов;

п — число

параллельных опытов.

Это приведет к некоторым

изменениям

в системе

нормальных

уравнений.

Пример 1. Пусть реализован эксперимент 22 с двумя параллельными опытами в каждой точке, который дал следующие результаты:

—4-1

- 1

—1“

 

-0 ,8 -

 

4-1

—1

+ 1

 

1,3

 

+ 1

+ 1

- 1

 

1,7

Ьо

4-1

4-1

4-1

 

2,6

 

В = bi .

+ 1

—1

—1

;

Y -- 0,6

4-1

—1

+ 1

 

1,5

_^2_

4-1

4-1 —1

 

1,7

 

__+ 1

+ i

+ 1_

 

_2,7_

 

Выпишем матрицу системы нормальных уравнений и найдем оценки коэффи­ циентов

 

 

 

 

 

 

'” 4-1

—1

- 1 —

 

 

 

 

 

 

 

- 1

+1

 

 

- + 1 + 1 + 1 + 1 4-1 + 1 + 1 4-П

4-1 + 1

—Т

'8 0 0"

 

4-1

+ 1

4-1

Х ГХ = - 1 - 1 + 1 1 1 4-1 +1

0 8 0 ;

+ 1 —1 —1

 

1 4-1 - 1 + 1 1 + 1 1 + 1_

4-1 - 1

+ 1

0 0 8

 

 

 

 

 

 

 

 

 

 

 

 

 

4-1

+1

- 1

 

 

 

 

 

 

 

-4 - 1 4-1 4-1-

 

 

 

 

 

 

 

- 0,8-

 

 

 

 

 

 

 

 

 

1,3

 

 

 

 

'4-1 + 1 4-1

4-1

4-1 4-1

+ 1 + П

1.7

 

12,9

 

 

2,6

 

 

ХТY =

1 —1 4-1

4-1

—1 1 4-1 4-1

0,6

 

4,5

 

 

1 4-1 —1 + 1

—1 + 1

1 + 1.

1,5

 

. 3,3 _

 

 

 

 

 

 

 

1.7

 

 

 

Вычислим значения Ь-коэффициентов

 

 

 

 

 

 

"1/8

0

0 ■

"12,9“

"1,6125"

 

 

В = (ХТХ)-1 XTY =

0

1/8

0

4,5 =

0,5625

 

 

 

 

0

0

1/8.

3,3

_0,4125

 

 

Таким

образом, #=1,6125 4-0,5625^ +0,4125т2.

 

 

 

173

В этом варианте расчета различные и параллельные опыты не дифференцировались. Можно поступить иначе, рассматривая

матрицу X как матрицу

различных опытов. Тогда для учета инфор­

мации о параллельных

опытах будем

 

использовать так называе­

мую матрицу весов. Она представляет

 

собой квадратную диаго­

нальную матрицу Р размера N X N .

Элементы главной

диагонали

равны числу повторных опытов соответствующих строк

матрицы

X. Нумерация строк матрицы X должна совпадать с нумерацией

строк матрицы Р.

 

 

 

 

 

 

 

 

В нашем

примере реализовано четыре различных опыта с двумя

параллельными. Поэтому

матрица

X

и

 

матрица Р имеют вид

 

" 4 - 1

— 1 1'"

 

 

" 2 0 0 0 "

 

х =

+ 1

- 1

+ 1

»

р

0

2

0

0

 

 

 

 

 

 

 

-f-i 4 - 1 — 1

а 0 0 2 0

 

 

+ 1

+ 1

+ 1

 

 

0

0

0

2

 

 

 

 

 

 

 

 

 

Тогда система нормальных уравнений МНК имеет вид (ХГР Х )В =

= X rPY, где Y — вектор-столбец средних значений по соответ­ ствующему числу параллельных опытов. Это усреднение необ­ ходимо, чтобы привести в соответствие размеры матриц, входя­ щих в систему нормальных уравнений. Коэффициенты регрессии определяются по формуле

В =

(ХТРХ)-1 ХТРY =

 

 

 

 

 

 

 

 

 

 

■ +1 + 1 + 1

 

" 2

0 0 0 "

' + 1 — 1 —Г

 

 

+ 1

0

2

0

0

+ 1

- 1

+ 1

 

 

— 1 — 1 + 1

+ 1

 

 

X

 

0

0

2

0

+ 1

+ 1

- 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

0 0 0 2

+ 1 + 1 + 1

 

 

4-1

+ 1

+ 1

+

1 '

" 2 0 0 0 "

" 0 , 7 0 "

 

 

 

 

 

0

2

0

0

 

1 , 4 0

 

 

 

 

 

— 1 — 1 + 1

+ 1

 

 

 

 

 

 

0

0

2

0

 

1 , 7 0

 

 

 

 

 

1

+ i

1

4 -i

 

 

 

 

 

 

0

0

0

2

 

2 , 6 5

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

 

2

2

2 2

' + 1 1 1 '

-1

 

2

2

2 2

" 0 , 7 0 "

 

+ 1

- 1

+ 1

 

 

'

 

-2 — 2 2 2

 

-2 —2 2 2

1 , 4 0

 

+ 1

+

1 - 1

 

1 , 7 0

 

-2 2 — 2 2

 

-2 2 — 2 2

 

+ 1 + 1 + 1

 

- 2 , 6 5

"8 0

0 “ -1

'

0 , 7 0

•2 4 - 1 , 4 0 . 2

4 - 1 , 7 0 . 2

4 - 2 , 6 5

•2"

 

0 8 . 0

- ^ 0 , 7 0 2 — 1 , 4 0 2 4 - 1 , 7 0 . 2

4 - 2 , 6 5 . 2

 

0 0

8

— 0 , 7 0

• 2 4 - 1 , 4 0

• 2 — 1 , 7 0 .2

4-2,65.2

 

174

— (0.70 4

1,40+ 1,70 +

2,65) • 2 —

 

 

8

2,65)

• 2

"1,6125"

(_ 0 ,7 0 — 1 ,40+ 1,70 +

0,5625

 

8

 

 

 

 

 

0,4125

(—0,70 +

1,40 — 1,70 +

2,65)

• 2

_

8

 

J

 

Как и следовало ожидать, результаты совпадают.

Хотелось бы обратить ваше внимание на то, что при равномер­ ном дублировании сохраняется ортогональность плана, и матрица нормальных уравнений остается диагональной. При отсутствии параллельных опытов матрица весов становится единичной.

А как теперь будет выглядеть статистический анализ резуль­ татов такого эксперимента? Рассмотрим проверку адекватности модели. При наличии числа повторных опытов п, равного для

всех строк плана,

дисперсия

адекватности

равна

Лг

 

 

 

 

n ^ W i- S i)3

 

 

 

sz — _i=i________

 

 

 

/V — +

1)

 

 

Числитель этого выражения

в матричной

форме имеет вид

N

_

_

_

 

п 2(9, — Уi f =

YrPY - B TX TPY.

 

»=i

 

 

 

 

Повторные опыты

накладывают более жесткие условия на про­

верку адекватности,

так как

рассчитанный /^-критерий увеличи­

вается в п раз и для принятия гипотезы адекватности требуется большее соответствие экспериментальных и расчетных точек. В рассматриваемом примере sj^=0,0312. Дисперсия воспроизводи­ мости для одинакового числа повторных опытов подсчитывалась, как уже говорилось в гл. 8, по формуле

2

22

__ >=1 *?=1________

5восир

N (п — 1)

Эта формула справедлива для однородных дисперсий.

Составим таблицу для расчета дисперсии воспроизводимости (табл. 10.4). Проверка показывает, что выборочные дисперсии

Таблица

10.4

 

 

 

 

 

 

Расчет дисперсии воспроизводимости

 

 

 

 

Номер

Матрица

V'

 

9

 

 

 

планиро­

У"

ДУ

Ду2

 

опыта

 

 

вания

 

 

 

 

 

 

1

(1)

0,8

0,6

0,70

0,10

0,0100

0,020

2

Ъ

1,3

1,5

1,40

0,10

0,0100

0,020

3

а

1,7

1,7

1,70

0,00

0

0

4

аЬ

2,6

2,7

2,65

0,05

0,0025

0,005

175

однородны GBBCU=0,44, GTa6j=0,91, a=0,05, ^ OC11P=0,0112. Для проверки адекватности линейной модели найдем /^-критерий: F=sj^/sBOCJip= 0 ,0312/0,0112~2,8. Табличное значение критерия Фи­ шера для числа степеней свободы 1; 4 и 5% уровня значимости (табл. 9.4) равно 7,7. Гипотеза адекватности линейной модели может быть принята.

Осталось проверить значимость ^-коэффициентов. Дисперсия оценки ^-коэффициентов равна s\bj) = slocnv/Nn = 0,0014. Дисперсия вос­ производимости siocnp, деленная на число параллельных опытов

п, называется дисперсией среднего и обозначается s\gy.

Отсюда имеем } = s\gy/N = 0,0056/4 = 0,0014. Этот же ре­ зультат получается из матрицы дисперсий-ковариаций (X^PXs^j)-1 или в нашем примере

[ 1/8

0

0

"0,0014

0

0

'

 

0

1/8

0 0,0112 =

0

0,0014

0

 

_

0

0

1 /8_

0

0

0,0014

Тогда

s\b0y=

5{б!} = s\b 2} =

0,0014. Если при проверке адекватности

используется

то числитель ^-критерия

не

нужно умножать

на п, поскольку на это число уже поделен знаменатель. Для ва­ рианта с равномерным дублированием опытов на практике можно использовать следующую эквивалентную схему обработки ре­ зультатов, учитывающую усреднение непосредственно.

1. Определим коэффициенты регрессии

N

2 g<XJi

7, _‘=1

Матрица X в этом случае содержит только отличающиеся вектор-

строки,

а матрица

Р = п Е.

2.

Найдем дисперсию адекватности

 

 

.V

 

 

S*

 

2 (Si — Si)2

 

= - i = ! ________

^

 

N (A 4- 1)

 

3. Оценим дисперсию среднего по строкам

 

 

лг

 

 

-2

 

2 (Viq — Si)2

 

 

 

*—1

 

 

s ‘

п{п — 1 ) •

 

 

170

4. Проверим гипотезу об однородности дисперсий и после ее принятия найдем общую дисперсию среднего

sm = 2 S(/W-

»=1

5. Затем вычислим дисперсии оценок коэффициентов регрес­ сии

s U j } s \yy ! N -

6. Наконец, проверим гипотезу адекватности модели

F = sljs\gy.

Применим эту схему обработки результатов к нашему примеру. В-табл. 10.5 повторены матрица планирования и средние значе­ ния откликов, а также приведены.данные, необходимые при про­ верке адекватности модели. Коэффициенты регрессии Ь0= 1,6125;

Таблица

10.5

 

 

 

 

 

Матрица планирования и результаты опытов

 

Номер

 

 

 

У

У

У — у

опыта

 

 

 

1

+1

—1

—1

0,70

0,6375

0,0625

2

+1

—1

+1

1,40

1,4625

—0,0625

3

+1

+1

—1

1,70

1,7625

—0,0625

4

+1

+1

+1

2,65

2,5875

0,0625

 

 

 

 

 

 

1

1

'-й

о

39

39

39

39

61 =

0,5625;

&2= 0,4125. Дисперсия адекватности

=

156-10"4.

Дисперсии среднего

по строкам

(табл. 10.4)

$? = 0,01,

$1 = 0,01,

$з =

0, $1 =

0,0025.

Критерий

Кохрена G =

0,44,

гипотеза об

однородности дисперсий принимается. Общая дисперсия среднего s\g}=0,0225/4=0,0056. Дисперсия оценок коэффициентов регрессии

s\b . ) = 0,0056/4 = 0,0014. Проверка гипотезы адекватности модели F = 0 ,0156/0,0056-2,8.

Пример 2. Пусть реализован план с неравномерным дублированием опытов [10], в котором первый опыт дублирован дважды. Матрица X имеет'вид

- + 1 - 1 - Г

х = + 1

+ 1

- 1

+1

- 1

_|_1

_ + 1

+ 1

+ 1_

\ 2 Заказ М 588

177

З а п и ш е м р еш ен и е си стем ы н о р м а л ь н ы х у р ав н ен и й с у ч етом весо в

Г„Л / г + 1

+ 1

+ 1

+ 1

2 0 0 0

 

 

0

1 0

0

 

 

 

— 1

+ 1

— 1 + 1

 

 

 

0

0

1 0

 

 

V-

—1

-1

4-1 4-1

 

 

0

0

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4-1 4_i 4_1 4_1‘

‘2 0 0 0

 

 

 

0

1 0

0

 

 

X — 1 4-1 — 1 4-1

 

 

0 0

1 0

 

 

 

— 1

— 1

4-1

4-1

 

 

 

0 0 0

1

 

 

 

 

 

 

 

 

 

Выполним

указанные

действия

 

 

 

 

 

2

1

1 Г

 

 

 

 

5 —1 —Г

- 2

1 —1 1

,

ХГРХ = —1

5

1

—2 —1

1 1

 

 

 

 

—1

1

5

Подчеркнем, что дублирование одного опыта нарушило ортогональность плана. Применение стандартных формул для подсчета коэффициентов регрес­ сии, используемых в случае ортогональных планов, стало неправомерным.

Найдем обратную матрицу (см. [1])

 

СО

1

(ХГРХ)-1

1

со

 

1

— 1

1

1

со

Наконец,

2 (Уп 4~ У12)

 

 

-4- и2 4- Уз + у4

 

 

2

 

Xr PY =

—2 (уц 4~ У12)

+ Уг — Уз + У4

 

2

 

_

—2 (уц + У12)

— У2+ Уз“Ь У4

 

2

 

В результате

имеем

 

 

1

г

 

Ун —1”У12 "ЬУг "ЬУз “ЬУ4

1

6

- 1

—Ун —У12 “ЬУг —Уз ~ЬУ4

1 —1

6

_—Ун —У12 —Уг Н-Уз 1У4

Заметим, что к тому же результату можно придти, используя обычные формулы для нахождения оценок коэффициентов ре­ грессии. Для этого в рассматриваемом примере достаточно срав­ нить соответствующие матрицы

-_f_i 4-1 4-1 4-1 4 - г

Г + 1 — 1 — I - !

- 5 — 1 —Г

4-1 —1 —1

х тх = —1 —1 4-1 —1 4-1

4-1 4-1 —1 =

— 1

5

1

—1 —1 —1 + 1 + 1

4-1 —1 4-1

— 1

1

5

L +i -И -И_

178

Г+ 1 + 1 + 1

 

 

Уп

+ 1

+п Уп

— 1 — 1 + 1

— 1 + 1

Уз

— 1 — 1 — 1 4-1 4-1

Уз

 

 

 

- J h -

У11 ~\~Уп ~\~Уз ~\~Уч +^4 —Уи —У12 2 —Уз +Уь —УП —У12 —У2 +Уз ~\~Уп

Положим, что в ходе экспериментирования производилось дублирование точек в соответствии с матрицей X и получены ре­ зультаты, изображаемые вектором Y

 

 

 

 

Уп

 

 

 

 

Уп

-4-1 —1 —1 '

 

 

4-1 —1 —1

раз

Ут,

+ 1

—1:

 

У21

 

У22

4-1 4-1 —1

п2 раз

Y =

+ 1

+ 1

+ 1

 

Узп2

 

 

4 - 1

4 - 1

4 - 1

раз

Уп

 

 

 

 

_

Уп

 

гдетг;

— число параллельных (дублированных)

опытов в i-x усло­

виях

i = l ,

2

Общее число всех опытов

будет равно

1=1

=

2 к

* - 1 ) + ^ *

 

 

»=i

 

 

Перейдем к более лаконичной форме записи условий и резуль­ татов эксперимента. Для этого введем матрицу весов Р. Это квад­ ратная диагональная матрица с элементами ри= п {

пх

п2

0

'

 

 

п3

 

0

 

 

 

п4

J

Эта матрица в совокупности с матрицей X, содержащей только неповторяющие строки, -задает условия эксперимента. А его ре­

1 2 *

179