Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

7286

.pdf
Скачиваний:
0
Добавлен:
23.11.2023
Размер:
1.04 Mб
Скачать

Таблица 4.

Номер

 

 

План

 

Результат

опыта

x0

x1

 

x2

x1×x2

опыта

1

+1

-1

 

-1

+1

y1

2

+1

+1

 

-1

-1

y2

3

+1

-1

 

+1

-1

y3

4

+1

+1

 

+1

+1

y4

В табл. 5 представлен насыщенный план для оценки восьми коэффициентов этой регрессии.

Таблица 5

Подобные планы экспериментов легко построить для любого числа факторов-переменных. Они называются полными факторными экспериментами (ПФЭ), т.к. в них реализуются все возможные сочетания уровней факторов (в табл. 5 для трех – x1, x2, x3). При этом знаки в столбцах для взаимодействий получают перемножением знаков взаимодействующих факторов.

Кратко опишем алгоритм использования ПФЭ с примером.

Прежде всего, отметим, что, несмотря на значительный выигрыш в

точности оценки коэффициентов регрессий, при использовании насыщенных планов адекватность полученных моделей проверить нельзя. Дело в том, что, во-первых, все результаты (yi) эксперимента использованы для оценивания коэффициентов регрессии. Для оценки отклонений ее предсказаний от реальных экспериментальных данных нет степеней свободы. По-существу, эти отклонения в насыщенных планах как бы отсутствуют – они не видны.

Во-вторых, все данные-отклики (yi) имеют, как предполагается,

случайные ошибки. Для проверки адекватности модели необходимо сравнить отклонения ее предсказаний от реальных экспериментальных данных с этими ошибками, например, по критерию Фишера. Если отклонения не значимо выше случайных ошибок, то модель считается адекватной и пригодной для практического использования.

Но, обычно, дисперсия случайной ошибки опыта неизвестна. Для ее оценки необходимо проводить дополнительные опыты. По ним удастся оценить случайную ошибку параметра y и сравнить ее с отклонениями предсказаний по модели. Итак, в насыщенных планах для проверки адекватности не остается данных.

Один из основных способов оценки случайных ошибок – проведение для каждого сочетания уровней входных факторов не одного, а нескольких

(K) опытов с использованием, по возможности, принципа рандомизации. В результате получают не одно (yi), а K значений (yi1, yi2, …, yiK) исследуемого выходного параметра, для которых затем находят среднее значение:

Далее проводят проверку т.н. воспроизводимости опытов. Опыт считается воспроизводимым, если дисперсия выходного параметра yi однородна (одинакова по величине) при каждом сочетании уровней входных факторов. Сначала оценивают дисперсию Syi случайной ошибки выходного параметра y для каждой сочетания по обычной формуле:

Нулевую гипотезу однородности дисперсий проверяют с помощью критерия Кохрена. Расчетное значение этого критерия определяют по формуле:

Критическое значение критерия Кохрена Gкр находят из специальной таблицы по числу степеней свободы числителя f=K-1, знаменателя f=N (число сочетаний уровней входных факторов в плане) и уровню значимости q. Если Gр<Gкр, нулевая гипотеза об однородности дисперсий принимается, в противном случае – отвергается. Тогда эксперимент необходимо повторить, изменив условия его проведения (набор входных факторов, интервал их варьирования, точность измерительных приборов и пр.).

Затем, если однородность доказана, проводят анализ значимости каждого коэффициента bi полученной регрессионной модели. Это

эквивалентно проверке значимости влияния каждого входного фактора и каждого взаимодействия на изменчивость выходного параметра y. Гипотезу о

статистической значимости (отличии от нуля) коэффициента проверяют по критерию Стьюдента. Расчетное значение tp этого критерия определяют как частное от деления модуля коэффициента bi на оценку его среднеквадратического отклонения Sb:

В ПФЭ оценки всех коэффициентов уравнения регрессии независимо от их величины вычисляются с одинаковой погрешностью (при выполнении условия воспроизводимости опытов):

где Sy – усреднения по N оценка дисперсии воспроизводимости эксперимента

Критическое значение критерия tкр находят из таблицы распределения Стьюдента по числу степеней свободы f=N(K–1) и уровню значимости q. Если tp>tкр, гипотеза о значимости коэффициента bi принимается: влияние соответствующего входного фактора или взаимодействия считается существенным. В противном случае коэффициент считается незначимым и приравнивается нулю: влияние отсутствует. Однако необходимо помнить, что незначимость коэффициента может быть обусловлена и неверным выбором интервала варьирования фактора. Поэтому иногда бывает полезным расширить интервал варьирования фактора и провести новый эксперимент.

Для проверки гипотезы об адекватности модели необходимо сравнить две дисперсии.

I) Дисперсия неадекватности, зависящая от разности между значениями yip, рассчитанными по модели, и экспериментальными результатами, усредненным по повторениям ( уj ):

где L – число оставшихся (значимых) коэффициентов исследуемого уравнения регрессии, не считая b0. То есть, при выявлении незначимых коэффициентов регрессии в насыщенном плане «высвобождаются» N-L степеней свободы, и данные опытов можно использовать для оценки дисперсии неадекватности.

Другой способ – получить оценку дисперсии неадекватности можно по

данным нескольких повторений, проведенных в каждом сочетании входных факторов:

II) Дисперсия воспроизводимости эксперимента, характеризующая случайные ошибки выходных наблюдений:

Подчеркнем, что дисперсия погрешности наблюдений может быть оценена путем сравнения результатов нескольких повторенных опытов, проводимых в каждой экспериментальной точке насыщенного плана.

Наконец, адекватность модели проверяется по F – критерию Фишера. Его расчетное значение находят как частное от деления оценки дисперсии неадекватности на оценку оценки дисперсии случайной ошибки опытов:

Критическое значение Fкр находят из таблицы распределения Фишера по числу степеней свободы числителя f=K(N–L), знаменателя f=N(K–1) и уровню значимости q. Если Fр>Fкр гипотеза об адекватности отклоняется.

Как правило, вначале проверяют адекватность простой линейной модели без взаимодействий. Если предположение об адекватности подтверждается, то в качестве окончательной модели выбирают линейную; если отклоняется – добавляют эффекты значимых взаимодействий и вновь проверяют гипотезу. Если в результате модель все же оказалась неадекватной, это говорит о том, что тип математической модели выбран неудачно. Следует использовать более сложныеэмпирические регрессионные модели, например, квадратичные.

Пример 1 (Грачев, Плаксин, 2005)

Получить регрессионное уравнение по следующим результатам плана

ПФЭ 23, представленным в табл. 6. Здесь S2(yku) – оценка дисперсии случайной ошибки в опыте; 9-й опыт проведен в центре эксперимента.

Таблица 6

1.Рассчитаем результаты-отклики, средние по повторениям:

2.Оценим коэффициенты регрессии:

Получаем уравнение регрессии:

3. Рассчитываем оценки дисперсий по данным в повторениях:

Подобным образом рассчитаны оценки дисперсий S2 с 3-я степенями свободы для остальных семи опытов плана и для опыта в центре эксперимента (см. таблицу 6).

4. Проверяем однородность этих дисперсий (воспроизводимость опытов):

Поскольку G < Gкр, то оценки однородны.

5. Средняя оценка дисперсии (с учетом опыта в центре эксперимента):

c числом степеней свободы: f=(N+1)(m-1)=27

6. Оценка дисперсии ошибки среднего по 4-м повторениям:

7.Оценка дисперсии ошибки любого коэффициента регрессии:

8.Плечо доверительного интервала этой ошибки:

следовательно, незначимо отличается от нуля только один коэффициент регрессии: b123=0,62<3,65. Тройное взаимодействие можно исключить из уравнения регрессии.

9.Оценка дисперсии неадекватности оставшейся части регрессионной модели проводится за счет одной высвободившейся степени свободы (с учетом незначимости тройного взаимодействия):

10.Проверка адекватности по критерию Фишера:

.

Следовательно регрессионная модель без тройного взаимодействия

адекватна и может быть использована для дальнейшего анализа изучаемого процесса.

Смысл взаимодействия виден на примере 8,12x1x2: выход продукта увеличивается на 8,12 единиц при сочетании x1 =+1, x2 =+1 или при сочетании x1 =-1, x2 =-1; уменьшается на 8,12 единиц при x1 =+1, x2 =-1 или x1 =-1, x2 =+1.

Задание. Для записи полученной адекватной регрессионной модели в реальных (исходных) физических величинах произведите обратный переход

от стандартизированного масштаба (+,-) к исходному – натуральному с помощью соотношения:

Дробный факторный эксперимент. С учетом объема априорной информации об изучаемом объекте для многих практических задачах в эмпирические регрессионные модели включают не все, а лишь некоторые взаимодействия первого порядка, иногда взаимодействия второго порядка и очень редко взаимодействия выше третьего порядка. Кроме того, на первых этапах исследования часто необходимо получить в первом приближении лишь линейную аппроксимацию поведения изучаемого объекта при минимальном числе экспериментов.

Так, для трех факторов вместо уравнения

y=b0+b1x1+b2x2+b3x3+b12x1×x2+b13 x1×x3+b23 x2×x3 +b123 x1×x2×x3

вначале достаточно рассмотреть уравнение вида:

y=b0+b1x1+b2x2+b3x3,

где нужно определить только четыре коэффициента. Поэтому использовать ПФЭ для определения коэффициентов только при трех линейных членах не эффективно из-за реализации большого числа опытов, особенно при значительном числе входных факторов.

Если при решении задачи можно ограничиться линейным приближением, то в ПФЭ оказывается много "лишних" опытов. Так, для трех факторов достаточно 4 опыта, а в ПФЭ их 8. Следовательно, есть четыре "лишних". Результаты этих "лишних" опытов могут быть использованы двояко: во-первых, с их помощью можно получить более точные оценки коэффициентов регрессии; во-вторых, их можно использовать вместо повторений опытов для проверки адекватности линейной модели. Однако, например, при 7 факторах ПФЭ содержит 27=128 опытов, а для оценки коэффициентов линейного уравнения требуется всего 8. Таким образом,

остается 120 лишних, и конечно, нет необходимости их все реализовать, а достаточно лишь несколько из них использовать для проверки адекватности и уточнения оценок.

Другими словами, ПФЭ обладает большой избыточностью опытов. В связи с этим возникает вопрос: нельзя ли сократить число опытов необходимых для определения коэффициентов регрессии?. Так, для определения коэффициентов уравнения

y=b0+b1x1+b2x2+b3x3,

достаточно ограничится четырьмя опытами, если в матрице плана ПФЭ 23 (табл. 4) использовать столбец х1х2 в качестве столбца плана для х3. Матрица планирования эксперимента примет вид, представленный в табл. 7.

Таблица 7

Заметим, что здесь использованы не все точки с "крайними" координатами для трех входных факторов, т.е. ±1, или говоря другими словами, не все возможные комбинации выбранных уровней. В самом деле, из всех

возможных комбинаций 23=8, мы использовали только 4.

Подобные сокращенные планы — носит название дробного факторного эксперимента (ДФЭ). Следует подчеркнуть, что формальное приравнивание взаимодействия (произведения) факторов дополнительному фактору (в данном случае x3), не входящему в это произведение, является

основополагающей идеей метода ДФЭ. В данном примере используется только половина ПФЭ 23. Поэтомуплан, представленный в табл. 7, называется

полурепликой от ПФЭ 23 или ДФЭ 23-1. После реализации четырех опытов этот насыщенный план даст оценку всех четырех требуемых коэффициентов линейной регрессии y=b0+b1x1+b2x2+b3x3.

Аналогично, матрица из 8 опытов для четырехфакторного планирования будет полурепликой от ПФЭ 24, (ДФЭ 24-1) а для

пятифакторного планирования достаточно четвертьреплики от 25 (ДФЭ 25-2) и т.д. При этом число опытов всегда должно быть не меньше числа коэффициентов.

В заключении отметим, что в пакетах статистических программ, например Statistika, есть каталоги различных планов ПФЭ и ДФЭ, а также программы соответствующих расчетов коэффициентов эмпирических регрессионных моделей, проверок их адекватности и пр.

Методы сокращения числа входных факторов. Зачастую в начале исследования неясно, какие входные факторы (xi) существенно влияют на выходной параметр y. Входных факторов может быть слишком много, и включить их все в эмпирическую модель невозможно. Какой бы удачный план эксперимента ни применить потребуется огромное число опытов: проявляется т.н. кризис размерности.

Разработан ряд методов предварительного сокращения числа входных факторов. Рассмотрим один из них – экспертный метод ранговой корреляции. Он основан на систематизации и обобщении знаний и опыта ведущих специалистов-экспертов в конкретной области исследования. Необходимые выводы делаются на основании их опроса и обобщения мнений.

Исследование по методу ранговой корреляции состоит из нескольких операций. Сначала составляется список факторов. При этом желательно учесть все факторы, подозреваемые в том, что они влияют на изучаемый процесс. Эти факторы нумеруются в произвольном порядке. Затем

составляется список специалистов-экспертов, мнение которых представляет интерес для исследования. Составляется таблица, где в каждой строке стоит название фактора, а в каждом столбце номер специалистаэксперта. Например, число опрошенных специалистов m = 25 (каждому из них присвоен определенный номер), число факторов-строк таблицы n = 14.

Каждому специалисту по отдельности вручается анкета-список факторов и предлагается пронумеровать их в порядке важности – т.е. присвоить фактору ранг. Результаты анкетирования переносятся в общую таблицу. Поскольку мнению каждого специалиста отведен свой столбец, ясно на какое место по степени важности он поставил каждый фактор. По каждой строке (ранги конкретного фактора) подсчитывается сумма рангов (суммируется мнение всех 25 специалистов о важности конкретного фактора). При этом первое место присваивается тому фактору, у которого сумма рангов ниже. Так проводится априорное ранжирование факторов на основе обобщения мнений экспертов.

Итак, результатом априорного ранжирования факторов является коллективная ранжировка. Этот результат проверяется по двум критериям, один из которых характеризует согласованность мнений специалистов, а другой достоверность. Для такой проверки необходимо, прежде всего, определить среднее значение суммы рангов всех факторов, которое равно

аср=0,5 m(n+1).

В примере аср = 0,5×25×15 = 187,5

После этого в специальный столбец таблицы заносится di – отклонение от среднего (аср), которое определяется как разность между суммой рангов в данной строчке таблицы (для i-го фактора) и значением аср. В следующий

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]