книги / Методы планирования экспериментов в области резания металлов и математической обработки результатов
..pdfпредставлены в табл. 20. Здесь использование точки вместо индекса указывает на суммирование по всем наблюдениям в данной совокупности.
|
|
|
|
Т а б л и ц а 20 |
||
Испытания |
I |
2 |
• • • |
У |
|
k |
|
|
X » |
|
|
|
х ,k |
|
Х^1 |
■Х22 |
|
Х2] |
|
X * |
|
А'31 |
х 32 |
|
Хь\ |
|
'Х*к |
|
• |
л |
|
• |
|
|
|
Х Ь |
Х\2 |
|
Хц |
|
Aik |
Средние со |
|
|
|
|
|
|
вокупностей |
Р-1=Я(Х и) |
г |
|
l*.j=£(A-ii) |
|
(A-k=^{Aik> |
|
|1.2= £(А 12) |
■ . • |
* 1 4 |
|||
|
|
|
|
|
Так как каждый элемент совокупности можно измерить, то из каждой совокупности можно взять бесконечное число наблюдений, поэтому £(Л'и) = |х.1 и т. д., а ц обозначает среднее A'JJ по всем совокуп ностям, т. е. Е (Xjj) = H“
В этой модели эффект испытания Ti также можно представить, как (JL.J—р. Тогда математическая модель будет иметь вид
=+ +
Тогда получается:
Хц - И- = (H.j - + {Хп - и )- |
(19) |
Поскольку эти средние значения совокупностей неизвестны, то из каждой совокупности берутся слу чайные выборки и можно получить оценки для общего среднего и средних каждой совокупности. Если для каждого испытания берутся щ наблюдений и не обя зательно, чтобы эти числа были одинаковы, то пред ставление выборочных данных может быть таким, как показано в табл. 21.
Здесь 7 \ j —сумма наблюдений, взятых в у-м испы таний, /ij—число наблюдений в у-м испытании, A’.j— наблюдаемое среднее для у-го испытания, Г..—общая сумма всех наблюдений.
Испытание |
1 |
2 |
j |
k |
|
|
|
X ,, |
|
Х , к |
|
|
Х и |
Х.Г, |
Л¥ ■21 |
л 2к |
|
|
|
• |
* |
т |
|
|
А], |
Ai3 |
* 4 |
Х\к |
|
Суммы |
|
Г.а |
7-J |
|
Т„ |
Число слагае |
|
|
|
|
|
мых |
п г |
«3 |
«J |
Пк |
N |
Средние |
Х л |
Х .3 |
X j |
х \ |
X.. |
Значения этих величин определяются следующими формулами [1].
А П\ |
|
|
7 \.= £ 2 * 4 * 2 7^ |
( 20) |
|
; - i ‘=1 |
/-1 |
|
Л] |
|
(21) |
у=1 |
|
|
х.. = 2 |
N |
(22) |
у'«=1 |
|
Подставляя эти выборочные статистики вместо соответствующих.параметров совокупности в тождест во (19), получаем:.
X Vi- Х . . = (Х.} - X ..) + (АГц - Л'.,), |
(23) |
Если обе части этого выражения возвести в квад рат *и просуммировать по i и j, то можно получить:
2 |
2 V ii - ^ - - ) 2== £ S ( Z ,- X ..) = + |
||
1 /1 |
/=1 /-1 |
|
|
+ 2 Е |
(Ar„-Xj)*+2EE (Jf.j-X .) |
>Г.л). (24) |
y-i A=I
|
k |
tlj |
_ |
_ |
В уравнении |
(24) член |
У, |
(Х.}—Х..) (Х^—Х.}} |
|
можно написать |
/-1 |
»—1 |
|
|
в следующем виде: |
|
у'=Д /=>1 |
|
к |
(25> |
|
|
jr 1 |
/-1 |
»j |
_ |
Однако здесь V. (A^ij-rAr.j) = 0, поскольку сумма от-
/-=1 клонений относительно среднего в пределах данного
испытания равна |
нулю. Следовательно, |
|
т |
Щ |
|
2 |
2 (X , - A-..)2+ |
|
J-1 i. 1 |
jf- 1 / - 1 |
|
+ |
S £ № J- X J)2. |
(26) |
y-1 /=1 |
|
|
Уравнение (26) считается основным уравнением |
||
дисперсионного анализа [1]. |
несмещенная |
|
В § 1 данной главы была получена |
||
оценка дисперсии |
п |
|
в виде Х — ^Х ^п . Если гипотеза,. |
||
|
/=•1 |
|
проверяемая с помощью дисперсионного анализа, вер на, т. е. если 7,i = 0 для всех у, то р.1 =р-.«=...= [>-кг и тогда в математическую модель входят лишь вели
чины н- и £jj (случайная ошибка). |
В этом случае |
Л”и = |i-l-s,j. |
(27} |
При этом любой член уравнения (25) можно ис пользовать для получения несмещенной оценки дис-
Щ _
Персии [1]. Например, разделив (XVl—X.^f на число*
/«1
степеней свободы ('>j—1), можно найти несмещенную оценк-у дисперсии для у-го испытания.
В случае, если дисперсии для всех ft—испытаний одинаковы, то, объединяя их оценки, можно получить
(28)
j- 1 <-1
т. е. оценку для дисперсии совокупности с N —k =
к
|
|
степенями свободы. Еще одна оценка |
||||
получаетсяI |
из равенства <з„“~х |
= tix z-n 2 . Так как |
|
|||
|
|
|
|
|
tli “x.j |
|
|
__ у ( X . j - X . . ) |
то несмещенной оценкой является |
||||
’x2= S |
- |
|||||
х |
/--i. |
ft- l |
|
|
|
|
величина |
|
|
|
|
|
|
|
|
|
A ni ( X j — |
х..у |
(2 9 ) |
|
|
|
°х |
у=1 |
/_ 1 |
• |
|
|
|
|
||||
|
|
|
|
|
|
Теперь, сравнив две независимые несмещенные •оценки одной и той же дисперсии, можно показать, что их отношение имеет F—распределение с ft—1 и N —ft степенями свободы. Когда гипотеза Н0 верна, то для ее проверки молено использовать критическую область ^ —распределения с ft—1 и N —k степенями •свободы. При этом
к_
2 щ (x .i - x . . y j k r-\
F & .- 1) (N-ю = ------------------------------- |
■ |
(3 0 ) |
£ t ^ n - X . t f l N - k
/=»1 /—.1
За критическую область распределения обычно принимается верхняя часть кривой ^ —распределения. Если F ^ F 2_в, то гипотеза Н0 отвергается таб личная величина, а ^ —расчетная величина). Гипотезу нужно отвергать в связи с тем, что существует разни ца между средними по испытаниям р.1г (х.2 и т. д.
Несмещенные оценки дисперсии (т. е. суммы квад ратов отклонений, деленные на соответствующее чис ло степеней свободы) называются также средними квадратами.
Исходя из теории дисперсионного анализа, мож-
но предложить следующие формулы для проведения однофакторного дисперсионного анализа [1]:
1. Между испытаниями —(Tj)
к
сумма квадратов SSHcn = У] щ (A'.j—Х..)" = /=-1
= |
|
- ■ - г . ^ |
|
|
|
|
||
средним |
квадратом будет |
55И СП |
где |
k — 1 — |
||||
число степеней |
свободы. |
Л -1. |
|
|
||||
|
|
|
||||||
2. Внутри испытаний |
(ошибка |
s(j) |
"j |
_ |
|
|||
|
|
|
|
|
к |
)2= |
||
сумма квадратов SS0IJI= > ] |
|
|
||||||
* |
"i |
|
* |
т |
j 1/_1 |
|
|
|
- 2 |
E A V |
- S ^ , . |
|
|
|
|
||
/™1 |
|
|
j - 1 «jJ |
|
55,OUI |
|
|
|
средним |
квадратом будет |
где |
N — k — |
|||||
число степеней |
свободы. |
Д'- A |
|
|
||||
|
|
|
||||||
3. Общая сумма |
|
|
|
к |
Пj |
|
|
|
сумма |
квадратов |
|
|
|
||||
55o6= J ] |
£ (Х ц —Х..)2=* |
|||||||
к |
П\ |
|
Т2.. |
/-1 |
1 |
|
|
|
- 2 |
2 я * « ~ |
|
|
|
|
|||
ЛГ |
|
|
|
|
||||
j=i «=1 |
|
|
|
|
|
где М—1—число степеней свободы.
Перейдем к рассмотрению нашего примера, обра щаясь снова к табл. 19. Здесь общая сумма квадратов представляет собой сумму квадратов всех наблюде
ний за вычетом поправочного |
члена ( |
- т* |
||||||||
|
|
A=4«j,“5 |
|
т2 |
|
|
( д |
. |
2 . |
|
5So6= I ] |
2 А Г '„ - % - .3 1 4 - 1 ^ = 3 1 3 .2 |
|||||||||
|
|
7>1 /=1 |
|
N |
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
= |
fc“4 |
<гз |
Г*.. |
— |
202 |
|
(-11)2 |
ь ^ + |
|
5Sпсп |
V |
Г -i |
' |
5 |
' |
5 |
||||
|
^ |
nj |
|
|
||||||
|
|
у=1 |
|
|
(-4)2 |
_ |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
«160,5. |
|
|
1 |
5 |
20 |
Сумма квадратов для ошибки определяется раз ностью SSo6 — SSucn и равна:
SS0U1 = SSc6— SSllcn= 313,2-160,5 = 152,7.
Составим теперь табл. 22 дисперсионного анализа для однофакториого эксперимента:
|
|
|
|
Таблица |
22 |
|
Источник |
Число |
Сумма |
Средний |
Математи |
||
изменчивости |
степеней |
квад |
квадрат |
ческое |
||
свободы |
ратов |
ожидание |
||||
.Между испы- |
k ~ 1 = 3 |
160,5 |
160,5/3=53,5 |
|
|
|
НИЯМИ ( T j) |
с е2 + |
5о0а |
||||
Ошибка ( е ц ) |
— Аг =16 |
152,7 |
152,7/16=9,54 |
V s |
|
|
•Сумма |
19 |
313,2 |
р |
5 5 ц с п |
= 5,63 |
|
|
|
|
|
S S Qш |
|
|
В большинстве случаев средний квадрат ошибки •считают равным математическому ожиданию среднего
.квадрата. Тогда принимается, что
a, 2 = S 2= 9 ,5 4 .
В этом случае средний квадрат между испытания ми, выраженным математическим ожиданием, опре деляется следующим выражением:
ИЛИ |
о02= о 2-|-5 з02 (//j= 5 ) |
(31) |
Чтобы определить общую дисперсию, необходимо знать значение с02. Последнее определяется так:
' V = — —г 2— = 8,8.
О
Следовательно, общая дисперсия оценивается-как
а0б2 = °о2 + <V« 8,8 + 9,54 ==18,34.
Таким образом, приблизительно 8,8/18,34x100% = —48% общей дисперсии относится к разнице в сред-
56
них* вносимой разными операторами, а оставшиеся 9,54/18,34X100%=52% обусловлены случайной ошиб кой. Интересно заметить, что если среднее квадра тическое отклонение в полном эксперименте оце нить как
0 |
„ 6 = 1/ТМ 4 = 4Д |
и эту величину |
умножить на 4, т. е. 4оо3=17,2, то |
можно ожидать, что разброс наблюденных показаний не превысит величины ± 2з0б.
Из таблицы 18 находим максимальное наблюдае мое значение 64 и минимальное 50 (или размах 14) для вышеуказанной достаточно маленькой выборки из 20 наблюдений. Следовательно, деление дисперсии на две части, соответствующие разным операторам и случайной ошибке, по крайней мере, допустимо.
§6. Общий регрессионный критерий значимости
Вэтом параграфе излагается метод для критерия значимости, который можно использовать в любых задачах дисперсионного анализа. Общий регрессион ный критерий значимости Дает такие же результаты, что и дисперсионный анализ. Однако этот метод ва жен еще и потому, что его легко можно распрост ранить на более сложные задачи.
Рассмотрим этапы статистического анализа при применении этого метода [1].
Допустим, что рассматривается та же самая за дача о стойкости резцов, приведенная в предыдущем параграфе, моделью которой является A’ij=|*+7,j-t-eij, Пусть т будет оценкой по методу наименьших квад ратов для |х, a — аналогичная оценка для 7\j. Для применения общего регрессионного критерия значи мости нужно провести следующие.операции:
1. Получить суммы, соответствующие испыта ниям. Здесь мы имеем четыре суммы, соответствую
щие, различным испытаниям: 7\j=20, |
—11, —15, 2. |
2. Найти общую сумму всех экспериментальных |
|
данных. |
|
Здесь общая сумма 7’.. = —4. |
уравнений, по |
3. Составить систему нормальных |
одному для каждой суммы. Неизвестными в этих уравнениях являются оценки параметров:
h
7\. = Ми + л 2 у-1
|
|
7\2 = |
пт -j- nt2_ |
|
|||
|
|
T . k = n m - } 7 n t v . |
|
||||
Здесь имеются следующие уравнения: |
|
||||||
|
—4 = |
20/Ti -j- —|—5£> 5£, —j—5£j |
|
||||
|
20 = |
Ът-{- 5fj |
|
|
|||
|
— 11 = |
5/я + |
5Д, |
|
(33) |
||
|
-1 5 = |
5/n + |
5f, |
|
|
||
|
|
2= |
5лте -j—5^.j. |
|
|
||
4. Решить |
эти |
уравнения |
относительно |
т и |
|||
|
k |
|
|
|
|
|
1 |
Поскольку |
2 ^ |
= 0» |
получается, что |
|
|||
|
/=1 |
|
|
|
|
|
|
— '4 = |
20т |
т = — 0,2 |
|
||||
U------------------- 4,2 |
|
t , ------ - i ^ - = - |
2 , 8 |
||||
|
|
|
|
|
|
5 |
|
t ,= |
- и ~ 5т |
= —2 |
= — ?=*!!------ .0,6. |
5. Получить регрессионную сумму квадратов. Для этого умножим каждый член левой части уравнений на соответствующую оценку, полученную в пункте 4.
55рсг (m.fj)« ( -4 ) (- 0,2) + 20 (4,2) +
+ (-1 1 ) ( - 2) + (-15) ( - 2,8) + 2 (0,6) —150.
6. Записать новую модель, опуская параметры, которые должны быть равны нулю, если проверяемая гипотеза верна, т. е.
Хц — [а+ Eij* та,< как ту®?0 {^<J:T'j —0),
7. Записать нормальные уравнения, соответст вующие новой модели. Получается всего одно урав
нение:
—4 — 20т.
8. Решить эту систему уравнений и определить регрессионную сумму квадратов, задаваемую ‘оцен ками оставленных параметров
т= -4/20 = -0,2..
9.Получить сумму квадратов между испытаниями
SSHCIi = |
SSpcrp (m, |
*j) -S S p Crp (™) |
$SIICI1= |
150^-0,8 = 150,8.' |
|
10. Получить: |
|
|
SS„„, = |
Хц |
—55perp (in, tj) |
|
j--i t-1 |
|
SS0II1 = |
313,2 -150,8 = 162,4. |
11. Построить F—статистику следующим образом:
p __ 55|,С|]/число |
степеней свободы __ |
150,8/3 |
__^ ^ |
55ош/число |
степеней свободы |
162,4/16 |
’ |
Значение F—статистики при регрессионном кри терии значимости получается меньше, чем значение, подсчитанное методом, приведенным выше, в первом параграфе. Это означает, что дисперсия случайных ошибок увеличилась. Тем не менее регрессионный критерий значимости считается хорошим и удобным приемом дисперсионного анализа.
Г л а в а IV
ОДНОФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ. РАНДОМИЗИРОВАННОЕ БЛОЧНОЕ ПЛАНИРОВАНИЕ. ОРТОГОНАЛЬНЫЕ КВАДРАТЫ
В этой главе рассматриваются планы для сравни тельных экспериментов. Вводятся такие новые поня тия, как рандомизированные блоки, ортогональные квадраты, которые являются основой факторного ана лиза, и требуют тщательного изучения.
§ 1. Полностью рандомизированное блочное планирование и однофакторные эксперименты
Допустим, необходимо провести эксперимент с целью сравнения t способов обработки и N, число имеющихся участков, удовлетворяет условию:
N = rt |
(34) |
где г — целое число.
Часто, при выборе суммарного числа участков, принимается, что это число кратно г. Здесь рассмат ривается следующее правило. Участки эксперимента делятся на. г блоков из t участков каждый, причем способы обработки распределяются по участкам та ким образом, что каждый из них встречается только один раз в блоке. После этого в каждом блоке произ водится случайный выбор одного участка для первого способа обработки, другого—для второго способа обработки и т. д. Таким образом, устанавливается новый случайный порядок в каждом блоке, что дает рандомизированный блок-план.
Сказанное можно проиллюстрировать на частном примере. Предположим, группу исследователей инте ресует износостойкость четырех различных типов корундовых пластин при одной и той же величине пути резания—20000 м. Причем измеряемой перемен ной величиной считается размерный износ резцов. Обозначим рассматриваемые марки корундовых рез цов буквами А, В, С, D. Резцы испытываются на то карном станке марки 1К 6 2 .
С целью избежания некоторых ошибок и получе ния достоверных данных разумно испытать комплект режущих пластин каждой марки в количестве четыре штуки, и опыты произвести на четырех однотипных станках I, II, III, IV.
Если, например, все пластинки типа А испытать на станке I, типа В—на станке II и т. д., то получился бы план полностью смешанным. В этом плане нельзя различать эффекты станков и марки. Последняя, ко нечно, является единственным интересующим нас фактором.
В случае составления полностью рандомизирован ного плана распределение 16 пластин между станками для испытания получилось бы совершенно случайно.