книги / Оптимизация процессов технологии металлов методами планирования экспериментов
..pdfРассмотрим вначале |
случай |
неравномерного |
дублирования |
(см. пример в п. 2.5.2.)- Прежде |
всего подсчитывают построчные |
||
дисперсии (дисперсии для каждого опыта): |
|
||
|
«и |
|
|
|
Е (yUg—Уи)г |
|
|
S lu = - ^ |
- fu--------, |
(2.71) |
|
где y Ug — результат g-го |
повторения ы-го опыта; |
у и — среднее |
|
арифметическое значение |
всех пи дублей и-го опыта; f u — число |
степеней свободы при определении и-й построчной дисперсии
S2yu\ fu ^ "и |
— 1• |
Заметим, |
что перед вычислением у и имеет смысл исключить |
возможные промахи (грубые результаты в сериях повторных опы тов) с помощью соответствующих статистических критериев (см., например, [43]).
Затем определяют среднюю дисперсию опыта из выражения
(2.72)
Эту же дисперсию можно подсчитать и другим способом.
Запишем |
(2.72) подробно: |
|
|
|
(«1 — 1) 'tiiyig— y i f |
(«2 — 1) |
'tiiy-ig— У*)2 |
o2 |
______in i_________ L ______ in i_________ L . . . |
||
_________(«1 — О_______ ________(«2 — 1 )________^ |
|||
y |
( « 1 — 1 ) 4~ («2 — !)+■■■ |
||
Следовательно, |
|
|
|
|
N |
nu |
|
|
E |
E (Vug- 9иу |
|
|
£2 __ u ~ \ |
g=\ |
(2.73) |
|
|
N |
|
|
|
E ( Я « - l) |
|
u— 1
Знаменатель выражений (2.72) и (2.73) — число степеней сво боды при определении дисперсии S y2 в случае неравномерного
дублирования:
/х = Е/«= Е ( П и - !)• |
(2.74) |
|
и — 1 |
«= 1 |
|
Однако, прежде чем пользоваться дисперсией, рассчитанной по формулам (2.72) и (2.73), необходимо проверить однородность ряда дисперсий, т. е. выяснить, определяются ли различные зна чения отклика с одинаковой точностью (ряд дисперсий однороден) или с разной (ряд неоднороден).
121
При неравномерном дублировании однородность ряда диспер сий проверяют по критерию Бартлетта. В этом случае вычисляют величину
|
В •-= 2,3026 f IgS' 2 |
|
/в IgS^'j, |
(2.75) |
|
|
V |
U—1 |
Ы—1 |
} |
|
где S \ — дисперсия, рассчитанная по формулам (2.72) |
или (2.73); |
||||
Sy |
— построчная дисперсия для «-го опыта, определенная с чис |
||||
лом |
степеней свободы /„. |
|
|
|
|
Найденную по формуле (2.75) величину В сопоставляют с кри |
|||||
терием х2> который берут из таблиц (см. приложение III) в зави |
|||||
симости от уровня значимости а и числа |
степеней свободы / = |
||||
= N' — 1 , где N* — число дублируемых опытов. Ряд дисперсий |
|||||
считается однородным в случае, |
если |
|
|
||
|
В ^ |
Ха; N* - 1 * |
|
(2.76) |
Значение Б, вычисленное по (2.75), всегда довольно сильно за
вышено. Если оно сравнимо или немного превышает х«; лг-ь т 0 В
уточняют по формуле
|
|
В* = |
В_ |
9 |
|
(2.77) |
|
|
|
с |
|
|
|
где |
|
\ |
|
|
|
|
/ |
N |
I N |
|
|
|
|
( |
? |
1 / |
+ |
1 . |
(2.78) |
|
С |
|
/ \ Т 1 |
\ |
|||
|
|
3 (ЛГ — |
1 ) |
|
||
и снова сравнивают с |
Ха, лг—i- |
|
|
дублирования опы- |
||
Рассмотрим теперь |
случай равномерного |
тов_(см. пример в п. 2.5.1). Здесь число повторений каждого опыта
одинаково: пи = п, |
поэтому |
формула |
(2.72) после преобразова |
|
ния: |
|
|
|
|
|
02 |
и—1 |
’ |
|
принимает вид |
|
N(n— 1 ) |
|
|
|
|
|
|
|
|
|
|
|
(2.79) |
а формула (2.73) |
вид |
|
|
|
|
N |
(Уиа |
Уи)“ |
|
|
2 |
|
||
|
g=l_________ |
(2.80) |
||
|
|
N (п— 1) |
|
|
|
|
|
|
122
Знаменатель выражения (2.80) — число степеней свободы при
определении дисперсии |
SI |
в случае равномерного дублирования: |
|
к |
= |
N (п - 1 ). |
(2.81) |
Прежде чем пользоваться формулами (2.79) и (2.80), вновь не обходимо проверить однородность ряда дисперсий. При однород ном дублировании эту проверку проводят по критерию Кохрена. Для этого определяют величину
драсч = S 2 |
(2.82) |
2
U=1
(Stf max — наибольшая в ряду дисперсия), |
которую сравнивают со |
|||
значением G-критерия, взятым из таблиц (см. приложение VI) в за |
||||
висимости от уровня значимости а, числа степеней свободы |
п — |
|||
— 1 и числа опытов N. Ряд дисперсий считается однородным, если |
||||
Срасч |
с табл_ |
|
(2.83) |
|
Закончив эксперимент, |
по |
формуле |
(2.16) в общем |
случае |
или по формулам (2 .1 1 ) или (2 |
.1 2 ) в случае ортогонального пла |
|||
нирования, рассчитывают |
коэффициенты |
регрессии. |
|
|
Легко показать [29, 6 ], что все эти |
формулы справедливы |
только при равномерном дублировании опытов плана или про ведении всех опытов без повторений. Если же опыты дублирова лись неравномерно или хотя бы один из параллельных опытов при равномерном дублировании «потерян», нарушается ортого нальность плана, и указанными формулами пользоваться нельзя. В этом случае условие эксперимента следует задавать матрицей X, содержащей только неповторяющиеся строки, и квадратной диаго нальной матрицей Р «весов» измерений, под которыми понимают число дублей:
« ! |
0 . . . |
0 |
о |
?s |
о |
р —
(2.84)
о |
о |
а результаты опытов — матрицей средних арифметических зна чений отклика для каждого и-то опыта:
|
У1 |
Y = |
У2 |
(2.85) |
Уы
Тогда вместо уравнения (2.16) для расчета коэффициентов ре грессии можно пользоваться формулой, вывод которой приведен, например, в работе [29]:
В = (X TP X ) _1 (X TP Y ). |
(2.86) |
123
Пример применения этой формулы см. в п. 2.5.2. Естественно, для того чтобы не нарушалась ортогональность,
опыты плана лучше дублировать равномерно.
После расчета коэффициентов проверяют гипотезу об их ста тистической значимости.
Следует сказать, что процедура проверки статистических гипотез в общем случае формально предусматривает сравнение некоторого критерия, рассчитанного по экспериментальным дан ным, с его табличным значением при выбранном заранее уровне
значимости а |
или, что то же самое, доверительной вероятности |
1 — а (если |
вероятности — в долях единицы). Уровень значи |
мости а по сути дела определяет наибольшую вероятность отверг нуть правильную гипотезу, т. е. наибольшую вероятность пред положения о том, что экспериментальный результат ошибочен. Например, если уровень значимости выбирают равным 0,05 (что очень часто делается в технических задачах), то это означает, что допускается 5%-ная вероятность неверного решения и доверитель
ная 95%-ная вероятность верного. |
1 |
Если найденное по экспериментальным данным значение кри терия попадает в область, соответствующую уровню значимости, то проверяемая гипотеза неверна и ее следует отвергнуть, совер шив ошибку с вероятностью а. Если же экспериментальное зна чение критерия попадает в область, соответствующую вероят ности 1 — а, то проверяемую гипотезу принимают, совершив
ошибку, связанную уже с альтернативной гипотезой.
Для проверки гипотезы о статистической значимости коэффи циентов регрессии прежде всего рассчитывают дисперсию оценок коэффициентов. Делают это в общем случае по формуле (2.23), а при ортогональном планировании — по формулам (2.27) или (2.28).
Если опыты дублируются, ковариационная матрица ортогональ ных планов (2.26) имеет вид
(Х ТР Х )-1 S i =
0. . . 0
о. . . s g , . . . о
о... о . . . s i k
|
s 2 |
|
|
|
by |
0 |
0 |
|
N |
||
|
|
|
|
ni |
хбa |
|
|
|
и— 1 |
|
|
|
|
4 |
1 |
|
0 |
0 |
|
|
N |
||
|
|
(2.87) |
|
|
«2 |
X x'iu |
|
|
|
u = 1 |
|
|
|
|
bys2 |
|
0 |
0 |
N |
|
|
|
|
|
|
|
% £ % |
|
|
|
и= 1 |
124
Отсюда, если число дублей одинаково и равно я, дисперсию
оценок коэффициентов рассчитывают |
по формуле |
S2 |
|
У |
( 2.88) |
N |
«V ,
и= 1
апри выполнении условия нормировки (2 .2 ) по формуле
(2.89)
Кстати, дисперсию S%hi часто называют дисперсией среднего
и обозначают S |.
При ортогональном планировании значимость коэффициентов можно проверять двумя равноценными способами. В одном слу чае можно сравнить абсолютную величину коэффициента с его
доверительным интервалом, рассчитываемым |
по формуле |
А*. - ta, f Sbr |
(2.90) |
где t — критерий Стьюдента, берется из таблиц (см. приложение II)
в зависимости от уровня значимости а и числа степеней свободы /д при определении дисперсии опыта Sy, S b. — среднеквадратичная
ошибка в определении коэффициента регрессии.
Коэффициент считается статистически значимым, когда его абсолютная величина больше доверительного интервала или равна
ему, т. е. |
|
(2.91) |
I |
|
|
или |
|
(2.92) |
I bi I ^ |
fjSbf |
Смысл последнего неравенства заключается в том, что абсолют ная величина коэффициента должна быть в t раз больше, чем
ошибка его определения.
В другом случае, значимость коэффициентов можно проверять
по ^-критерию, рассчитывая его по формуле |
|
||
^расч _ |
| bf | |
(2.93) |
|
|
“ |
Sbt |
|
|
|
||
Коэффициент значим, если /|>асч больше или |
равен tZffl, т. е. |
||
^расч |
^ |
^табл |
(2.94) |
1 |
la: fr |
Статистическая незначимость коэффициента интерпретируется как отсутствие влияния соответствующего эффекта. Если модель линейная и соответственно незначим линейный эффект, можно счи тать, что данный фактор в изученных интервалах его изменения на отклик не влияет. При ортогональном планировании статисти
125
чески незначимые коэффициенты из модели могут быть исключены, при этом пересчет остальных коэффициентов не требуется.
Указанный способ построения доверительных интервалов для каждого из коэффициентов в общем случае оценки их статистиче ской значимости является недостаточным. Строго говоря, сле дует оценивать совместную доверительную область одновременно для всех коэффициентов [77, 38, 74, 20, 104, 53], которая и пред ставляет собой упоминавшийся в разделе 2 . 1 эллипсоид рассеяния
оценок коэффициентов регрессии. Доверительный интервал для отдельного коэффициента можно тогда установить, если выбрать некоторые фиксированные значения для остальных коэффициен тов. Поэтому при неортогональном планировании проверка ста тистической значимости коэффициентов является непростой зада чей. Тем не менее рекомендуется и в этом случае проверять гипо тезу о значимости коэффициентов по /-критерию [52, 77, 38, 104, 53 |. Другим способом упрощения модели путем исключения из нее коэффициентов является последовательный регрессионный ана лиз [77, 38, 117].
Следующим этаном обработки данных является проверка гипотезы об адекватности модели, т. е. поиск ответа на вопрос, можно ли использовать полученное уравнение или необходима
более сложная |
модель. |
чаще всего проверяют |
с помощью |
|||
Гипотезу об |
адекватности |
|||||
/''-критерия (критерия Фишера). Его |
расчетное значение опреде |
|||||
ляют по формуле |
|
|
|
|
|
|
|
^ р а с ^ ф д |
_ |
|
|
(2.95) |
|
В знаменателе этого выражения — дисперсия |
опыта |
оп |
||||
ределенная с |
/х — числом |
степеней |
свободы, |
в |
числителе — |
так называемая дисперсия неадекватности 5?1еад, которую считают по формуле
JV
|
|
<2 |
— и = 1 |
(У«расч |
^эксп) |
SSнсад |
(2.96) |
|
|
|
|
|
|||||
|
|
Оцеад |
— |
h |
|
|
||
|
|
|
|
|
|
|
|
|
гдеии |
\\ии |
|
— значения отклика в и-м опыте, соответственно |
|||||
- '“ расч |
'/и эксп |
|
|
|
|
|
|
рассчитанные по уравнению регрессии и определенные эксперимен
тально; /? — число степеней |
свободы, определяемое |
как |
/ 2 |
= /V - k \ |
(2.97) |
где k' — число оставленных коэффициентов уравнения (включая b0), N — число опытов плана.
Таким образом, F — критерий, представляющий собой отно
шение дисперсии неадекватности и дисперсии опыта, по сути дела отвечает на вопрос, во сколько раз модель предсказывает хуже по сравнению с опытом.
126
Гипотезу об адекватности уравнения принимают в том случав, когда рассчитанное значение /^-критерия не превышает таблич ного (см. приложение V) для выбранного уровня значимости, т. е. когда
Я’асч < Етабл. |
(2.98) |
Следует отметить, что формула (2.96) справедлива лишь при отсутствии дублирования опытов в матрице планирования. При этом для расчета ^-критерия используют дисперсию S 2yt опреде
ленную по опытам, не входящим в план, например, дублируя опыты в центре плана.
Если для определения SI повторяют опыты плана, то числитель
формулы (2.96), назовем |
его |
S S neaA, рассчитывают |
по-разному, |
||
в зависимости от способа дублирования. |
|
||||
При неравномерном дублировании |
|
|
|||
З^неад — |
2 |
Пи(Уирасч' |
^'эксп)2» |
(2.99) |
|
и=1 |
|
|
|
|
|
где эксп — среднее из пи дублей и-го |
опыта. |
|
|||
При равномерном дублировании |
|
|
|||
SSneafl = |
п |
2 |
(^/ирасч |
$ «эк сп )2, |
( 2 .1 0 0 ) |
|
|
U=\ |
|
|
Если же дублируется только один опыт, например первый,
то:
N
5 5 неад = п \ (1/1расч |
^эксп)2 + £ (#"расч |
#«эксп)2- (2.101) |
и = 2
Гипотезу об адекватности линейного уравнения, построенного по результатам полного или дробного факторного эксперимента типа 2к или 2к~Р, можно проверить и другим способом. Вспомним, что в этом случае коэффициент Ь0 всегда является оценкой
к
К -> Р„ + Ъ IV
1=1
Но величина Ь0 в свою очередь является, по сути дела, оценкой
результата опыта в центре плана, когда уровни всех факторов в кодовом масштабе равны нулю. Поэтому, если выполнить опыт на основном уровне, т. е. получить у0, и найти разность \bQ— yQ|,
то эта величина является оценкой суммы квадратичных членов типа b£i в уравнении регрессии. Если разность \Ь0 — у0\ велика,
линейным уравнением пользоваться нельзя, если эта разность мала, то возможность использования линейного уравнения не исключена. Здесь следует иметь в виду, что коэффициенты Ьи
могут быть с разными знаками, а потому сумма их — небольшой величиной.
127
Значимость различия между bQ и у0 можно оценить по /-кри
терию:
(2.102)
где Sy — среднеквадратичная ошибка опыта, определенная при /х
степенях свободы.
Гипотеза об адекватности уравнения не отвергается в случае, когда
(2.103
Примеры статистического анализа данных, полученных в раз ных ситуациях, см. в разделе 2.5.
В заключение отметим одну особенность задач технологии металлов, которую необходимо учитывать при использовании ме тодов планирования экспериментов. При изучении влияния со става на свойства сплавов факторами являются элементы химиче ского состава. Следовательно, план эксперимента предусматри вает приготовление ряда сплавов определенного химического со става. Но готовить сплавы точно заданного состава (а этого тре буют предпосылки регрессионного анализа) не всегда просто. В том случае, когда попадание в состав неудовлетворительно, как и во всех остальных случаях непопадания факторов на заданный уровень, можно попытаться учесть ошибки в определении факто ров.
Известно несколько решений данной задачи [6 8 , 126, 14, 42].
Приведем конечные результаты одного из них [42].
В рассматриваемых ситуациях действительный уровень /-го фактора в м-м опыте представляет собой
(2.104)
где хсц — действительный уровень фактора; Xiu — заданный уро вень; Eiu — ошибка попадания на заданный уровень; xt 9 xtuJ
— в кодовом масштабе.
Если ошибки е* в уровнях факторов хь не коррелируют ни
между собой, ни с намеченными уровнями факторов, то при ис пользовании полного 2k или дробного факторного 2 к~Р экспери
мента коэффициенты моделей следует считать по формуле
N
(2.105)
и = 1 |
и = 1 |
128
или, с учетом условия нормировки (2.2),
N
(2.106)
и=1
Дисперсии в определении скорректированных коэффициентов рассчитывают из выражений
5 '> |
Л' |
|
(2.107) |
|
2 |
|
н=] |
|
и- А |
|
|
или, с учетом условия |
нормировки, |
|
|
|
|
У |
(2.108) |
|
|
N |
|
|
|
в? |
|
|
N |
У |
|
|
|
|
и |
и =1
В качестве критерия целесообразности корректировки можно использовать сопоставление остаточных дисперсий, рассчитан ных по формуле (2.96). Если остаточная дисперсия S l CTl корректи
рованного уравнения оказывается меньше дисперсии 5остг Урав нения, построенного без учета ошибок факторов, данная корректи ровка будет целесообразна. Если дисперсии SoCTl и SOCT2 соизме римы по своей величине, это означает, что непопадание на задан ные уровни факторов весьма незначительно сказывается на ве личине коэффициентов и корректировку можно не проводить.
Пример использования указанной выше корректировки при веден в п. 2.5.5.
Когда фиксация факторов на заданных уровнях происходит с очень большими нарушениями, факторы (независимые перемен ные) можно считать случайными переменными, значения которых меняются от одного опыта к другому в соответствии с некоторым распределением. В этом случае следует вообще отказаться от ис пользования регрессионного анализа и воспользоваться, например, конфлюентным анализом 155, 78].
2.5. ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ ФАКТОРНЫХ ПЛАНОВ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕХНОЛОГИИ МЕТАЛЛОВ
Использование различных планов, описанных выше, иллю стрируется в данном разделе примерами. Из многочисленных за дач технологии металлов, решенных с помощью планирования эксперимента (см. например, библиографию в работе 14]), выбрано
129
несколько, имеющих типовую постановку и методические особен ности решения. Основное внимание уделяется методическим во просам и в меньшей степени содержательному анализу получен ных данных.
Решение любой задачи с помощью методов планирования по следовательно проходит через неформализованные этапы и более или менее формализованные. Примерами неформализованных являются этапы постановки задач, принятия решения при выборе зависимых и независимых переменных, выборе плана и стратегии эксперимента, при интерпретации полученных моделей и т. д. К формализованным этапам можно отнести процедуры составле ния выбранного плана эксперимента, расчета коэффициентов мо делей, проверки статистических гипотез, реализации методик тех или иных способов оптимизации и т. п.
Опыт применения методов планирования для решения самых разных задач, в том числе и технологии металлов, показал, что успех чаще всего определяется действиями все-таки на этапах неформализованных. Это важно иметь в виду, поскольку в приве денных ниже примерах неформализованные этапы подробно рас сматриваться не будут. Цель этих примеров, как и книги вообще, — показать способы действий на формализованных этапах. Решения же на неформализованных этапах в каждом конкретном случае свои, они определяются физико-химическим смыслом решаемой задачи. Описать их дли всех случаев невозможно, да и интерес они представляют только для специалистов в данной конкретной области техники. Вряд ли, например, литейщику интересно чи тать подробное описание различных аспектов решения задачи из области обработки металлов давлением Заинтересовать его могут только те моменты, которые помогут решить свою задачу, а эти моменты, прежде всего, методические.
Описание примеров приведено с разной степенью подробности, причем подробность описания уменьшается от первых примеров в данном разделе к последним. Дело в том, что каждая процедура анализа данных подробно рассмотрена только в том примере, где впервые используется. Поэтому рекомендуется просмотреть все примеры, обращая внимание на постановку задач и особенности их решения. Очень полезно также повторить все вычисления, для чего достаточно использовать ЭКВМ.
2 .5 .1 . И С П О Л Ь З О В А Н И Е П О Л Н О Г О Ф А К Т О Р Н О Г О Э К С П Е Р И М Е Н Т А 2 4 С Р А В Н О М Е Р Н Ы М
Д У Б Л И Р О В А Н И Е М О П Ы Т О В
Использование планов полного факторного эксперимента типа 2 k проиллюстрируем следующим примером.
Изучали зависимость некоторых литейных и механических свойств синтетического чугуна, предназначенного для литья в ко
1 3 0