Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Методы планирования экспериментов в области резания металлов и математической обработки результатов

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.4 Mб
Скачать

рандомизированным, если эксперимент с несколькими уровнями фактора проводится в совершенно случай­ ном порядке. С другой стороны, нелогично, когда рассматривается рандомизация до того, как уже опи­ саны планы, к которым она относится.

Рандомизированный блок-план должен иметь в каждом блоке обычно один участок, который выбира­ ется случайным образом для каждого способа обра­ ботки. Необходимо учесть то обстоятельство, что в рандомизированном блок-плане любой блок планиру­ ется независимо от другого блока. Факторные планы со смешиванием рандомизируются аналогичным обра­ зом, т. е. так, чтобы все блоки имели бы один участок.

Единственное исключение состоит

в том, что не все

комбинации способов обработки

встречаются здесь

в каждом блоке.

 

Отметим, что точный механизм рандомизации имеет значение только для потребителей планов и не представляет теоретического интереса. Большой интерес представляет следующий вопрос: для чего необходима какая-либо рандомизация? Является ли допустимым какое-либо отклонение от случайности при проведении экспериментов?

Ясно одно, что нельзя рандомизацию рассматри­ вать как норму. В первую очередь рандомизация явля­ ется средством обеспечения того, что сравнения спо­ собов обработки не являются смещенными вследствие приписки одного способа обработки к „лучшим" участ­ кам. Как бы не был честен экспериментатор, если он имеет свободу выбора в рамках явных ограничений, он, вероятно, должен быть предрасположен в пользу результатов за или против одного из способов обра­ ботки [3].

Некоторые американские исследователи считают, что рандомизацию можно рассматривать как аналог страхования. Нет сомнения, что если не принят метод рандомизации, стандартным методом статистического анализа можно получить одни и те же выводы. Здесь трудность состоит в опознании того, каковы эти экс­ перименты.

Многие экспериментаторы считают, что некото­ рые обстоятельства делают рандомизацию ненужной. Возможно, они правы, но если они неправы, то их результаты могут полностью вводить в заблуждение,

после чего станет невозможным устранить появив­ шиеся подозрения. Конечно, в случае, если экспери­ ментатор настаивает на том, что его эксперимент не может быть или не будет рандомизированным, то окончательная ответственность лежит на нем.

Резюмируя вышеизложенное, можно отметить, какие преимущества имеет рандомизация [3]:

1. Несмотря на сложность ограничений в некото­ рых планах экспериментов, рандомизация исключает из стандартных методов дисперсионного анализа по­ сторонние источники неслучайных колебаний, связан­ ных с этими ограничениями, и приводит к статисти­ чески несмещенным оценкам дисперсии или дисперсии разностей между средними значениями способов об­ работки.'

2. В дисперсионном анализе при нулевой гипоте­ зе о том, что способы обработки дают одинаковый эффект, подходящая рандомизация дает возможность получить равные математические ожидания средних квадратов для способов обработки и ошибок.

3. Если „ошибки" или отклонения полученных в действительности урожаев от их математических ожиданий нормально распределены, то отношение среднего квадрата по способам обработки к соответ­ ствующему среднему квадрату ошибки в дисперсион­ ном анализе будет следовать распределению диспер­ сионного отношения стандартных распределений.

Эти свойства достаточны, чтобы рандомизацию сделать составной частью хорошего плана экспери­ мента, ею не следует пренебрегать, если только нет очень серьезных причин.

§ 4. Понятие статистического вывода

Понятие статистического вывода разделяется на две части:

1.Оценка,

2.Проверка гипотезы.

Как известно, статистические выводы относятся к процессу получения какого-либо заключения отно­ сительно всей совокупности. Обычно, как сказано выше, совокупность характеризуется одним или не-1 сколькими параметрами.

Целью статистической оценки является отыскание

оценки параметра совокупности на основе выбороч­ ной статистики, взятой из этой совокупности. Вообще требуется два типа оценок: .точечные оценки и интер­ вальные оценки.

Под точечной оценкой подразумевается числен­ ное значение статистики, используемое для оценки

параметра. Например, выборочное среднее х является точечной оценкой средней совокупности JA. Обычно точечные оценки должны быть несмещенными и иметь ми ни мальную дисперсию.

В математической статистике несмещенной стати­ стикой называется статистика, математическое ожида­ ние которой равно оцениваемому параметру совокуп­ ности. Выборочное среднее и выборочная дисперсия являются несмещенной статистикой.

Оценка,- имеющая наименьшее среднее квадрати­ ческое отклонение, называется оценкой с минималь­ ной дисперсией.

При интервальной оценке определяется интервал, в котором рассматривается параметр совокупности. При этом доверительным интервалом для данного па­ раметра считается диапазон значений между гранич­ ными точками интервала.

Доверительные пределы определяются наблюден­ ной выборочной статистикой, размером выборки и требуемой степенью достоверности. Допустим, для -^=95% доверительный интервал имеет вид [1]:

x==± \ i9Q—l — t

/п

где число 1,96 взято из таблицы нормального распре­ деления, /I — является размером выборки, о — среднее квадратическое отклонение совокупности. При не­ известном значении величины о для вычисления до­ верительного интервала используется t— распределе­

ние Стыодента.

интервал

имеет вид:

Доверительный

-

,

,

5

X ±

t\—д/2 * ——

У И

здесь S —выборочное среднее квадратическое откло­ нение, которое определяется по'(17), t имеет (л—1)

степеней свободы, причем требуемая степень досто­ верности задается значением 100 (1—я) %.

Статистическая гипотеза—это некоторое предпо­ ложение относительно свойств совокупности, из ко­ торой производится выборка. Под этим предположе­ нием обычно подразумевается то, что одному или нескольким параметрам совокупности приписывается некоторое значение, которое в дальнейшем прове­ ряется. Проверка гипотезы—это правило, согласно ко­ торому гипотеза либо принимается, либо отвергается*

Приведем пример и на нем покажем последова­ тельность проверки гипотезы. Допустим, путь резания обычного резца.с определенной режущей пластинкой равен в среднем 5000 м (критерий износа — появле­ ние фаски износа на задней поверхности резца ши­ риной 0,3 мм). Эту гипотезу можно записать так:

5000 м. Проверять эту гипотезу, значит при­ нимать или отвергать Яо:(г = 5000 м. В случае, если

при испытании окажется, что среднее х выборки из 25 резцов не превышает 4000 м, гипотеза отвергается. Критическая область статистики для проверки гипо­ тез состоит из всех значений статистики, при кото­ рых принимается решение отвергнуть гипотезу //0.

В данном примере для проверочной статистики л* кри­ тической областью считается область, в которой

х^ 4000 м.

Всвязи с тем, что проверка гипотез обычно основывается^на наблюденных выборочных статистиках, при принятии решений всегда возможны ошибки. В случае, если отвергается в действительности верная гипотеза, то говорят, что совершается ошибка пер­ вого рода, вероятность которой обозначается бук­ вой а. В случае, если принимается неверная гипотеза

Н0, т. е. верна альтернативная гипотеза, то делается ошибка второго рода. Вероятность ошибки второго1 рода обозначается буквой (3.

Вероятности а и р в большинстве случаев рас­ сматриваются как риск принять неправильные реше­ ния. Исходя из этого, одной из целей при проверке гипотез является построение критерия, для которого и а, и р были бы малы [!]•

Проверка гипотезы производится по следующим этапам:

Фиг. 3.

1.Определяется гипотеза и ее альтернатива,.т. е.

#0:[а= 5000 м

Нг:\1 — 5000 м,

2.Устанавливается уровень значимости (разброса) или ошибки первого рода аг=0,05.

3.Выбирается статистика для проверки гипотезы

Нй по известной формуле [1]

2 = j £ - j 0 j / n _

(18)

а

 

(обычно принимается с= 2).

4. Устанавливается критическая область для про­ верки гипотезы Н0. При этом гипотеза Н0 отвергается в 100% а выборок, когда она верна (z ^ —1,645).

5. Получается случайная выборка размера п, вы­ числяется по ней статистика и решается, верна ли

гипотеза Н0. Если п — 25 и л: = 4,4 км, то

2= i ^ = - l , s .

2 //2 5

Так как —1 , 5 —1,645, то гипотеза Н0 не отвер­ гается. Значение z ^ —1,645, т. е. критическая область,

определяется уравнением л: = -Н,96 — где вместо

V п

+51,96 выбирается число + 1,64 (из таблицы распреде­ ления Стыодента). Потом из площади под кривой нор­ мального распределения (фиг. 3) при значении —1,64

определяется, что значение 2 = —1,64—0,0455——1,645 (доля полной площади /г = 2а = 0,1, т. к.а = 0,05).

Таким образом, критическая область г выбирается исходя из k и значения нормального распределения Стыодента 1,64, т. е.

z= l,64 ± С1 (где*С1 в 0,0455).

Понятно, что в данном примере правая часть не может повлиять на исход решения, т. к. гипотеза больше Я0:р = бООО м не должна быть. Поэтому критйческая область охватывает значение г = —1,645, т. е. левую часть.

Чтобы определить значение точки А (фиг. 3), мож- -но пользоваться уравнением (18), принимая 2 ^ —1,645:

Хк —5

_

— 1,645= -----— , отсюда Ха^ + 4 ,3 км.-

2 //2 5

 

Теперь правило принятия

решения можно выра­

зить следующим образом: гипотеза Н0отвергается,если

х а ^ 4,Ъ км. При JC= 4,4 км гипотеза не

отвергается.

В данном .примере не обращалось

внимания на

ошибку второго рода (р). Чтобы вычислить вероят­ ность р ошибки второго рода, нужно принять, что гипотеза Н0 не верна и что верна некоторая альтер­ нативная гипотеза: допустим Л2 [1]. Тогда можно сказать, что р зависит от Нг и, задавая различные зна­ чения км, можно получить разные значения р.

Например, при ^ = 4,5 км распределение выбо­ рочных средних относительно 4,5 км будет таким, как показано на фиг. 4.

Здесь вероятность (3 вычисляется как площадь под кривой нормального распределения:

г — -4,-~У = - 0 ,5 .

2 / /2 5

Потом из таблицы нормального распределения определяется Сг, после чего:

Р = 1 — 1 -0,3015 = 0,6985.

В случае, если принять ри=4 км, то 2=0,75. Теперь выбирая Сг из таблицы как среднее арифметическое значение от z=0,7 и z=0,8, получаем, что р=0,2266.

Следовательно, вероятность р меняется с измене­ нием истинного значения р и уменьшается по мере удаления р влево от значения 5 км.

Так как р изменяется в зависимости от р, можно -построить кривую р как функции р (фиг. 5).

Иногда строится график значений CTj = 1 — р в зависимости от р. Этот график (фиг. 6) называется кривой функции мощности данного критерия и строит­

ся с помощью таблицы

17.

Т а б л и ц а 17

 

 

 

 

р

4,3 — р

Р

1-Р

Примечание

2 //2 5

~

 

 

 

5,5

2

0,02

0,98

 

3,8

1,25

0,11

0,89

 

4

0,75

0,23

0,77

 

4,5

- 0 ,5

0,69

0,31

 

4,7

- I

0,84

0,16

приближенно равно а

5

- 1 ,7 5

0,96

0,04

Из этих кривых видно, что мощность критерия: можно повысить путем увеличения размера выборки или риска а.

Вопрос размера риска а легко контролировать,, исходя из самого примера. Однако для выбора раз­ мера выборки необходимо ответить на каждый из следующих вопросов [1]:

1.Какова величина смещения параметра, кото­ рую желательно обнаружить?

(например, от 5 км к 4,5 км).

2.Какова величина разброса или изменчивости совокупности?

(величина о).

3.Какой размер риска желательно принять?, (на­ пример а = 0,05, р = 0,1).

Если эти числовые величины могут быть оценены,; то можно определить размер выборки.

Запишем систему двух уравнений, нормирующих

значение Ха, во-первых, отнрсительно ц=5 км (по а) и, во-вторых, относительно ='4,5^лгл£ (по Р). После

решения этих уравнений относительно п и ха полу­ чаются:

а) — 1,645 =

ХА ~ 5 , соответствующее а = 0,05

 

v i n

JQ

4 5

б) 1,282= ■*

соответствующее {3= 0,1

2 / / Л

(2==1,282 подобран из таблицы распределения Стыодента и соответственно из таблицы площади под. кривой нормального распределения).

Решение этих уравнений дает п—137 и Лд=4,72 км* Таким образом, если возьмем случайную выборку из 137 резцов и если среднее значение для этой вы­ борки меньше 4,72 км, то отвергаем гипотезу Н0, а в противном случае принимаем гипотезу Н0.

§ 5. Дисперсионный анализ

Дисперсионный анализ тесно связан с планиро­ ванием. В этом параграфе рассматривается лишь не­ сколько основных положений дисперсионного - ана­ лиза.

Основная теорема последнего касается разбиения суммы квадратов отклонений.

Выводим приемы дисперсионного анализа для конкретного случая: при однофакторном экспери­ менте. Однофакторным считается такой эксперимент,, когда изменяется только один фактор, независимо от того, являются ли его уровни качественными или количественными [1].

Приведем пример. Допустим, исследуется четыре различных типа резцов (т. е. четыре различные марки твердых сплавов) на стойкость. Поскольку исследу­ ется лишь четыре типа резцов, то это однофактор­ ный эксперимент с четырьмя уровнями. Эти уровни количественные, так как стойкость нельзя оценить качественно. Нами было решено, что достаточно брать по 5 наблюдений для каждого 1 типа резца. Таким образом, получается 20 резцов для проведения дан­ ного эксперимента. Порядок проверки этих 20 резцовможно полностью рандомизировать, т. е. проводить планирование экспериментов в совершенно случайном порядке. При этом любой материал, который, нужно обрабатывать, можно приближенно считать однород­ ным. Ниже приводятся значения стойкости для четы­ рех типов испытуемых резцов (табл. 18).

Для проведения анализа вычитываем из каждого показания стойкости (табл. 18) закодированную ве­ личину 58. Величина 58 получается, если число 1155 разделить на число наблюдений iV = 20. Ниже, в таб­

лице 19, представлены закодированные данные стой-' кости резцов.

Т а б л и ц а 18

МЬ

.Стойкость в мин.

 

наблюдений

I резец

1Г резец

 

I

60

59

2

62

50

3

64

55

4

63

58

5

61

57

Сумма

310

279

Испытания

I

2

3

4

 

2

1

- 6

- 2

 

4

- 8

- 7

- 3

 

6

- 3

—5

I

 

5

0

1

" 2

 

3

- 1

2

4

7\j=7\3 суммы

 

 

 

 

наблюдений,

 

 

 

 

взятых в 5 ис­

20

- 1 1

- 1 5

2

пытаниях

Лj = ns число

5

5

5

5

наблюдений

5

 

 

 

 

1

90

75

115

* 34

 

 

 

 

IIГ резец

IV резец

52

56

51

55

53

59

59

60

60

62

275 292 Всего| 1156

Т а б л и ц а 19

*

Общая сумма всех наблюдений 7 \.= —4

Сумма всех наблюде­ ний N = 2 0

4 5

2 Е * ’л = з 14

/=*1 1

Теперь, для вычисления суммы квадратов откло­ нений средних по испытанию, а также суммы квад­ ратов для ошибки и общей суммы квадратов всех наблюдений, перейдем к объяснению некоторых по­ ложений теории дисперсионного анализа. Допустим, взяты ^-совокупностей* каждая из которых соответ­ ствует одному варианту исследования, и эти данные