книги / Методы планирования экспериментов в области резания металлов и математической обработки результатов
..pdfрандомизированным, если эксперимент с несколькими уровнями фактора проводится в совершенно случай ном порядке. С другой стороны, нелогично, когда рассматривается рандомизация до того, как уже опи саны планы, к которым она относится.
Рандомизированный блок-план должен иметь в каждом блоке обычно один участок, который выбира ется случайным образом для каждого способа обра ботки. Необходимо учесть то обстоятельство, что в рандомизированном блок-плане любой блок планиру ется независимо от другого блока. Факторные планы со смешиванием рандомизируются аналогичным обра зом, т. е. так, чтобы все блоки имели бы один участок.
Единственное исключение состоит |
в том, что не все |
комбинации способов обработки |
встречаются здесь |
в каждом блоке. |
|
Отметим, что точный механизм рандомизации имеет значение только для потребителей планов и не представляет теоретического интереса. Большой интерес представляет следующий вопрос: для чего необходима какая-либо рандомизация? Является ли допустимым какое-либо отклонение от случайности при проведении экспериментов?
Ясно одно, что нельзя рандомизацию рассматри вать как норму. В первую очередь рандомизация явля ется средством обеспечения того, что сравнения спо собов обработки не являются смещенными вследствие приписки одного способа обработки к „лучшим" участ кам. Как бы не был честен экспериментатор, если он имеет свободу выбора в рамках явных ограничений, он, вероятно, должен быть предрасположен в пользу результатов за или против одного из способов обра ботки [3].
Некоторые американские исследователи считают, что рандомизацию можно рассматривать как аналог страхования. Нет сомнения, что если не принят метод рандомизации, стандартным методом статистического анализа можно получить одни и те же выводы. Здесь трудность состоит в опознании того, каковы эти экс перименты.
Многие экспериментаторы считают, что некото рые обстоятельства делают рандомизацию ненужной. Возможно, они правы, но если они неправы, то их результаты могут полностью вводить в заблуждение,
после чего станет невозможным устранить появив шиеся подозрения. Конечно, в случае, если экспери ментатор настаивает на том, что его эксперимент не может быть или не будет рандомизированным, то окончательная ответственность лежит на нем.
Резюмируя вышеизложенное, можно отметить, какие преимущества имеет рандомизация [3]:
1. Несмотря на сложность ограничений в некото рых планах экспериментов, рандомизация исключает из стандартных методов дисперсионного анализа по сторонние источники неслучайных колебаний, связан ных с этими ограничениями, и приводит к статисти чески несмещенным оценкам дисперсии или дисперсии разностей между средними значениями способов об работки.'
2. В дисперсионном анализе при нулевой гипоте зе о том, что способы обработки дают одинаковый эффект, подходящая рандомизация дает возможность получить равные математические ожидания средних квадратов для способов обработки и ошибок.
3. Если „ошибки" или отклонения полученных в действительности урожаев от их математических ожиданий нормально распределены, то отношение среднего квадрата по способам обработки к соответ ствующему среднему квадрату ошибки в дисперсион ном анализе будет следовать распределению диспер сионного отношения стандартных распределений.
Эти свойства достаточны, чтобы рандомизацию сделать составной частью хорошего плана экспери мента, ею не следует пренебрегать, если только нет очень серьезных причин.
§ 4. Понятие статистического вывода
Понятие статистического вывода разделяется на две части:
1.Оценка,
2.Проверка гипотезы.
Как известно, статистические выводы относятся к процессу получения какого-либо заключения отно сительно всей совокупности. Обычно, как сказано выше, совокупность характеризуется одним или не-1 сколькими параметрами.
Целью статистической оценки является отыскание
оценки параметра совокупности на основе выбороч ной статистики, взятой из этой совокупности. Вообще требуется два типа оценок: .точечные оценки и интер вальные оценки.
Под точечной оценкой подразумевается числен ное значение статистики, используемое для оценки
параметра. Например, выборочное среднее х является точечной оценкой средней совокупности JA. Обычно точечные оценки должны быть несмещенными и иметь ми ни мальную дисперсию.
В математической статистике несмещенной стати стикой называется статистика, математическое ожида ние которой равно оцениваемому параметру совокуп ности. Выборочное среднее и выборочная дисперсия являются несмещенной статистикой.
Оценка,- имеющая наименьшее среднее квадрати ческое отклонение, называется оценкой с минималь ной дисперсией.
При интервальной оценке определяется интервал, в котором рассматривается параметр совокупности. При этом доверительным интервалом для данного па раметра считается диапазон значений между гранич ными точками интервала.
Доверительные пределы определяются наблюден ной выборочной статистикой, размером выборки и требуемой степенью достоверности. Допустим, для -^=95% доверительный интервал имеет вид [1]:
x==± \ i9Q—l — t
/п
где число 1,96 взято из таблицы нормального распре деления, /I — является размером выборки, о — среднее квадратическое отклонение совокупности. При не известном значении величины о для вычисления до верительного интервала используется t— распределе
ние Стыодента. |
интервал |
имеет вид: |
|
Доверительный |
|||
- |
, |
, |
5 |
X ± |
t\—д/2 * —— |
У И
здесь S —выборочное среднее квадратическое откло нение, которое определяется по'(17), t имеет (л—1)
степеней свободы, причем требуемая степень досто верности задается значением 100 (1—я) %.
Статистическая гипотеза—это некоторое предпо ложение относительно свойств совокупности, из ко торой производится выборка. Под этим предположе нием обычно подразумевается то, что одному или нескольким параметрам совокупности приписывается некоторое значение, которое в дальнейшем прове ряется. Проверка гипотезы—это правило, согласно ко торому гипотеза либо принимается, либо отвергается*
Приведем пример и на нем покажем последова тельность проверки гипотезы. Допустим, путь резания обычного резца.с определенной режущей пластинкой равен в среднем 5000 м (критерий износа — появле ние фаски износа на задней поверхности резца ши риной 0,3 мм). Эту гипотезу можно записать так:
— 5000 м. Проверять эту гипотезу, значит при нимать или отвергать Яо:(г = 5000 м. В случае, если
при испытании окажется, что среднее х выборки из 25 резцов не превышает 4000 м, гипотеза отвергается. Критическая область статистики для проверки гипо тез состоит из всех значений статистики, при кото рых принимается решение отвергнуть гипотезу //0.
В данном примере для проверочной статистики л* кри тической областью считается область, в которой
х^ 4000 м.
Всвязи с тем, что проверка гипотез обычно основывается^на наблюденных выборочных статистиках, при принятии решений всегда возможны ошибки. В случае, если отвергается в действительности верная гипотеза, то говорят, что совершается ошибка пер вого рода, вероятность которой обозначается бук вой а. В случае, если принимается неверная гипотеза
Н0, т. е. верна альтернативная гипотеза, то делается ошибка второго рода. Вероятность ошибки второго1 рода обозначается буквой (3.
Вероятности а и р в большинстве случаев рас сматриваются как риск принять неправильные реше ния. Исходя из этого, одной из целей при проверке гипотез является построение критерия, для которого и а, и р были бы малы [!]•
Проверка гипотезы производится по следующим этапам:
Фиг. 3.
1.Определяется гипотеза и ее альтернатива,.т. е.
#0:[а= 5000 м
Нг:\1 — 5000 м,
2.Устанавливается уровень значимости (разброса) или ошибки первого рода аг=0,05.
3.Выбирается статистика для проверки гипотезы
Нй по известной формуле [1]
2 = j £ - j 0 j / n _ |
(18) |
а |
|
(обычно принимается с= 2).
4. Устанавливается критическая область для про верки гипотезы Н0. При этом гипотеза Н0 отвергается в 100% а выборок, когда она верна (z ^ —1,645).
5. Получается случайная выборка размера п, вы числяется по ней статистика и решается, верна ли
гипотеза Н0. Если п — 25 и л: = 4,4 км, то
2= i ^ = - l , s .
2 //2 5
Так как —1 , 5 —1,645, то гипотеза Н0 не отвер гается. Значение z ^ —1,645, т. е. критическая область,
определяется уравнением л: = -Н,96 — где вместо
V п
+51,96 выбирается число + 1,64 (из таблицы распреде ления Стыодента). Потом из площади под кривой нор мального распределения (фиг. 3) при значении —1,64
определяется, что значение 2 = —1,64—0,0455——1,645 (доля полной площади /г = 2а = 0,1, т. к.а = 0,05).
Таким образом, критическая область г выбирается исходя из k и значения нормального распределения Стыодента 1,64, т. е.
z= l,64 ± С1 (где*С1 в 0,0455).
Понятно, что в данном примере правая часть не может повлиять на исход решения, т. к. гипотеза больше Я0:р = бООО м не должна быть. Поэтому критйческая область охватывает значение г = —1,645, т. е. левую часть.
Чтобы определить значение точки А (фиг. 3), мож- -но пользоваться уравнением (18), принимая 2 ^ —1,645:
Хк —5 |
_ |
— 1,645= -----— , отсюда Ха^ + 4 ,3 км.- |
|
2 //2 5 |
|
Теперь правило принятия |
решения можно выра |
зить следующим образом: гипотеза Н0отвергается,если
х а ^ 4,Ъ км. При JC= 4,4 км гипотеза не |
отвергается. |
В данном .примере не обращалось |
внимания на |
ошибку второго рода (р). Чтобы вычислить вероят ность р ошибки второго рода, нужно принять, что гипотеза Н0 не верна и что верна некоторая альтер нативная гипотеза: допустим Л2 [1]. Тогда можно сказать, что р зависит от Нг и, задавая различные зна чения км, можно получить разные значения р.
Например, при ^ = 4,5 км распределение выбо рочных средних относительно 4,5 км будет таким, как показано на фиг. 4.
Здесь вероятность (3 вычисляется как площадь под кривой нормального распределения:
г — -4,-~У = - 0 ,5 .
2 / /2 5
Потом из таблицы нормального распределения определяется Сг, после чего:
Р = 1 — 1 -0,3015 = 0,6985.
В случае, если принять ри=4 км, то 2=0,75. Теперь выбирая Сг из таблицы как среднее арифметическое значение от z=0,7 и z=0,8, получаем, что р=0,2266.
Следовательно, вероятность р меняется с измене нием истинного значения р и уменьшается по мере удаления р влево от значения 5 км.
Так как р изменяется в зависимости от р, можно -построить кривую р как функции р (фиг. 5).
Иногда строится график значений CTj = 1 — р в зависимости от р. Этот график (фиг. 6) называется кривой функции мощности данного критерия и строит
ся с помощью таблицы |
17. |
Т а б л и ц а 17 |
|||
|
|
|
|
||
р |
4,3 — р |
Р |
1-Р |
Примечание |
|
2 //2 5 |
|||||
~ |
|
|
|
||
5,5 |
2 |
0,02 |
0,98 |
|
|
3,8 |
1,25 |
0,11 |
0,89 |
|
|
4 |
0,75 |
0,23 |
0,77 |
|
|
4,5 |
- 0 ,5 |
0,69 |
0,31 |
|
|
4,7 |
- I |
0,84 |
0,16 |
приближенно равно а |
|
5 |
- 1 ,7 5 |
0,96 |
0,04 |
Из этих кривых видно, что мощность критерия: можно повысить путем увеличения размера выборки или риска а.
Вопрос размера риска а легко контролировать,, исходя из самого примера. Однако для выбора раз мера выборки необходимо ответить на каждый из следующих вопросов [1]:
1.Какова величина смещения параметра, кото рую желательно обнаружить?
(например, от 5 км к 4,5 км).
2.Какова величина разброса или изменчивости совокупности?
(величина о).
3.Какой размер риска желательно принять?, (на пример а = 0,05, р = 0,1).
Если эти числовые величины могут быть оценены,; то можно определить размер выборки.
Запишем систему двух уравнений, нормирующих
значение Ха, во-первых, отнрсительно ц=5 км (по а) и, во-вторых, относительно ='4,5^лгл£ (по Р). После
решения этих уравнений относительно п и ха полу чаются:
а) — 1,645 = |
ХА ~ 5 , соответствующее а = 0,05 |
|
v i n |
JQ |
4 5 |
б) 1,282= ■* |
соответствующее {3= 0,1 |
2 / / Л
(2==1,282 подобран из таблицы распределения Стыодента и соответственно из таблицы площади под. кривой нормального распределения).
Решение этих уравнений дает п—137 и Лд=4,72 км* Таким образом, если возьмем случайную выборку из 137 резцов и если среднее значение для этой вы борки меньше 4,72 км, то отвергаем гипотезу Н0, а в противном случае принимаем гипотезу Н0.
§ 5. Дисперсионный анализ
Дисперсионный анализ тесно связан с планиро ванием. В этом параграфе рассматривается лишь не сколько основных положений дисперсионного - ана лиза.
Основная теорема последнего касается разбиения суммы квадратов отклонений.
Выводим приемы дисперсионного анализа для конкретного случая: при однофакторном экспери менте. Однофакторным считается такой эксперимент,, когда изменяется только один фактор, независимо от того, являются ли его уровни качественными или количественными [1].
Приведем пример. Допустим, исследуется четыре различных типа резцов (т. е. четыре различные марки твердых сплавов) на стойкость. Поскольку исследу ется лишь четыре типа резцов, то это однофактор ный эксперимент с четырьмя уровнями. Эти уровни количественные, так как стойкость нельзя оценить качественно. Нами было решено, что достаточно брать по 5 наблюдений для каждого 1 типа резца. Таким образом, получается 20 резцов для проведения дан ного эксперимента. Порядок проверки этих 20 резцовможно полностью рандомизировать, т. е. проводить планирование экспериментов в совершенно случайном порядке. При этом любой материал, который, нужно обрабатывать, можно приближенно считать однород ным. Ниже приводятся значения стойкости для четы рех типов испытуемых резцов (табл. 18).
Для проведения анализа вычитываем из каждого показания стойкости (табл. 18) закодированную ве личину 58. Величина 58 получается, если число 1155 разделить на число наблюдений iV = 20. Ниже, в таб
лице 19, представлены закодированные данные стой-' кости резцов.
Т а б л и ц а 18
МЬ |
.Стойкость в мин. |
|
наблюдений |
I резец |
1Г резец |
|
||
I |
60 |
59 |
2 |
62 |
50 |
3 |
64 |
55 |
4 |
63 |
58 |
5 |
61 |
57 |
Сумма |
310 |
279 |
Испытания |
I |
2 |
3 |
4 |
|
2 |
1 |
- 6 |
- 2 |
|
4 |
- 8 |
- 7 |
- 3 |
|
6 |
- 3 |
—5 |
I |
|
5 |
0 |
1 |
" 2 |
|
3 |
- 1 |
2 |
4 |
7\j=7\3 суммы |
|
|
|
|
наблюдений, |
|
|
|
|
взятых в 5 ис |
20 |
- 1 1 |
- 1 5 |
2 |
пытаниях |
||||
Лj = ns число |
5 |
5 |
5 |
5 |
наблюдений |
||||
5 |
|
|
|
|
1 |
90 |
75 |
115 |
* 34 |
|
|
|
|
IIГ резец |
IV резец |
52 |
56 |
51 |
55 |
53 |
59 |
59 |
60 |
60 |
62 |
275 292 Всего| 1156
Т а б л и ц а 19
*
Общая сумма всех наблюдений 7 \.= —4
Сумма всех наблюде ний N = 2 0
4 5
2 Е * ’л = з 14
/=*1 1
Теперь, для вычисления суммы квадратов откло нений средних по испытанию, а также суммы квад ратов для ошибки и общей суммы квадратов всех наблюдений, перейдем к объяснению некоторых по ложений теории дисперсионного анализа. Допустим, взяты ^-совокупностей* каждая из которых соответ ствует одному варианту исследования, и эти данные