Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория инженерного эксперимента

..pdf
Скачиваний:
18
Добавлен:
12.11.2023
Размер:
13.91 Mб
Скачать

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ

Теперь, когда мы накопили достаточное количество данных, упорядочили их и отсеяли ошибочные результа­ ты, можно приступить к их анализу. В технике такой анализ может проводиться в форме обработки данных (data reduction), построения графиков и исследования численными или аналитическими методами. В последние годы инженеры-механики, инженеры-электротехники и инженеры-строители стали понимать, что возможно и желательно статистическое исследование получаемых ре­ зультатов. В тех случаях, когда вследствие больших за­ трат или выхода аппаратуры из строя не удается в до­ статочной степени контролировать эксперимент или полу­ чить необходимый объем данных, общие статистические выводы могут оказаться единственным возможным ко­ нечным продуктом. Вдругих случаях статистические выво­ ды могут дополнять обычный инженерный график или таблицу результатов.

Это очень обширная тема, поэтому автор позаимство­ вал из фундаментальных работ по математической стати­ стике лишь некоторые идеи, которые находят наиболее широкое применение в обычной инженерной практике. Необходимо иметь в виду, что существуют значительно более сложные, более изящные и более эффективные методы, чем те, которые будут описаны в данной главе. В большинстве случаев для применения этих более со­ вершенных методов требуются специальные таблицы, осо­ бые приготовления и обширные вычисления. Именно по этой причине в промышленных и научных организациях из года в год увеличивается количество специалистов в области математической статистики.

В данной главе будут рассмотрены методы, позволяю­ щие ответить на следующие простые и важные вопросы.

10—108

Если имеется две или большее число групп данных, то принадлежат ли они одной и той же совокупности? Если наблюдается ряд событий, то являются ли они результа­ том действия большого числа случайных факторов или же их распределение во времени и пространстве подчи­ няется определенной схеме? Читателю не представляет труда убедиться в том, что эти вопросы имеют отношение к огромному множеству важных инженерных эксперимен­ тов.

8.1. Терминология: два вида ошибок статистического вывода

В гл. 2 были рассмотрены такие важные понятия и термины, как генеральная совокупность и выборка, нор­ мальный закон, среднее квадратическое отклонение, сред­ нее значение и т. д. Большинство этих терминов является статистическими понятиями. Теперь используем понятия математической статистики не для обнаружения и описа­ ния случайных ошибок в измерительных приборах, а как средство анализа всего эксперимента, поэтому необ­ ходимо ввести некоторые дополнительные термины. Наи­ более важным является такое понятие, как значимость эксперимента или результатов эксперимента. Можно утверждать, что эксперимент, в котором 2 0 образцов стали марки А разрушились при давлении 4200 ±

± 350 кГ/см2, а 20 образцов стали марки В разрушились при давлении 5600 ± 350 кГ/см2, является высокозначи­ мым, поскольку он доказывает, что сталь марки В имеет более высокую прочность. Математик не станет возра­ жать против этого мнения, хотя он может порекомендо­ вать провести проверку значимости, которая позволила бы представить этот высокозначимый результат в виде некоторого числа. Если бы у 20 образцов стали марки В прочность оказалась равной 4430 ± 350 кГ/см2, то мы выразили бы сомнение в том, является ли сталь марки В более прочной, и статистический метод проверки был бы более необходим. При выполнении статистических прове­ рок, ряд которых будет описан в последующих разделах, рассматривается возможность появления двух типов оши­ бок статистического вывода. Ошибка первого рода имеет место, когда мы приписываем наблюдаемым различиям

некоторый реальный эффект, а в действительности ника­ кого эффекта нет. Так, можно утверждать, что сталь марки В (с прочностью 4430 ±350 кГ/см2) определенно прочнее стали марки А, и приступить к закупкам и использова­ нию только стали марки В. Последующие исследования (на более крупных выборках) могут показать, что между этими марками стали по существу нет различия, так что, выбрав на основе первоначальной выборки из 2 0 образцов сталь марки В, мы допустили ошибку первого рода. Для уменьшения вероятности ошибки первого рода необхо­ димо, чтобы результаты испытаний имели высокую зна­ чимость, но тогда увеличивается риск появления ошибки второго рода, которая имеет место, когда игнорируется реальный эффект или различие, которое в действительности существует. Например, можно решить, что различие между марками стали А и В не является значимым, и применять обе марки, не проводя между ними различий. Последую­ щие испытания могут показать, что сталь марки В несом­ ненно прочнее, чем сталь марки А, и что нами допущена ошибка второго рода.

Эти идеи могут показаться довольно очевидными, одна­ ко они освещают некоторые существенные аспекты ста­ тистического вывода, играющие особенно важную роль при решении инженерных задач. Большинство инженер­ ных экспериментов приводит в конечном счете к тому или иному действию, и нет какого-либо определенного правила, устанавливающего нежелательность ошибок пер­ вого рода по сравнению с ошибками второго рода. Если испытывается устройство раскрытия парашюта, то про­ стые соображения гуманности заставляют избегать воз­ можности появления ошибки второго рода (которая со­ стоит в том, что не будет выбрано действительно наилуч­ шее устройство), в то время как ошибка первого рода (выбор наиболее дорогого устройства, которое кажется надежнее других) не является столь серьезной. И наобо­ рот, если из большой группы реле требуется выбрать реле для установки на дешевую детскую игрушку, то ошибка второго рода (состоящая в том, что не будет выбрано са­ мое лучшее реле), по-видимому, не столь серьезна, как ошибка первого рода (выбор реле определенной конструк­ ции, которое в действительности не лучше других, но бо­

лее дорогое). Эти идеи станут яснее после того, как мы рассмотрим в последующих двух разделах конкретные методы и проблемы.

8.2. Проверка значимости с помощью у2-критерия

Во многих случаях данные, получаемые в эксперимен­ те, представляют собой число объектов. Например, опре­ деленное число деталей может быть принято или забра­ ковано при приемке, пройти испытания на долговечность или выйти из строя до их завершения, продано или воз­ вращено обратно. При приемке может быть пропущено некоторое число бракованных деталей и обнаружены дефекты у некоторых других либо может быть забрако­ вано некоторое число исправных деталей и принято неко­ торое другое число исправных деталей. Может рассматри­ ваться число деталей, изготовленных за данную смену или определенным рабочим, либо на данном станке или сбо­ рочной линии, либо с помощью некоторого производствен­ ного метода и т. д. Счет числа частиц космического излу­ чения, числа испытаний, числа автомобилей, числа карто­ чек, угадываемых на парапсихологическом сеансе, мо­ жет давать разные результаты в различные дни недели, различные смены, в различных местах и для различных лиц. Многие испытания такого рода можно проверять на значимость с помощью у2 -критерия.

Вывод распределения у2 (которое по форме несколько отличается от нормального распределения, рассмотренного в гл. 2 ) здесь не дается, однако он приводится во многих книгах по математической статистике (см., например, [111). Вычислим вначале у2 по формуле

(8. 1)

где О обозначает наблюдаемое число событий (например, отказов, реализованных товаров, забракованных изде­ лий, изготовленных предметов, зарегистрированных ча­ стиц, правильных ответов и т. д.), а Е математическое ожидание числа этих событий. Когда мы говорим о мате­ матическом ожидании, то вводим гипотезу, которая может

быть истинной или ложной. Допустим, например, что необходимо узнать, на каком токарном станке — новом или старом — мы получим больше хороших деталей. Для этого на каждом станке изготавливается одинаковое число деталей и проверяемая гипотеза гласит: «Оба стан­ ка выпускают одинаковое число хороших деталей». Или же на основе предыдущего опыта можно сказать: «Яа новом станке получаем хороших деталей на одну треть больше, чем на старом». Каждую из этих гипотез можно проверить, вычислив соответствующее значение х2- Од­ нако, прежде чем показать, как это делается, необходимо рассмотреть еще один новый термин. При любом — таб­ личном или графическом — представлении распределе­ ния х2 необходимо знать число степеней свободы, связан­ ных с экспериментом. Число степеней свободы — это число независимых групп наблюдений, охватываемых гипотезой. Это понятие всегда несколько пугает начи­ нающих исследователей, поэтому стоит привести некото­ рые примеры.

Допустим, что отдел закупок приобрел маломощные двигатели — половину в фирме А и половину в фирме В. Через некоторый промежуток времени вышли из строя Fa двигателей фирмы А и Fb двигателей фирмы В. Общее

число неисправных

двигателей

постоянно

и равно

(Ра + Fb). Допустим

теперь, что

требуется

проверить

гипотезу, согласно которой число отказавших двигателей обеих фирм одинаково. Тогда ожидаемое число Fa можно принять равным (Fa + Fb)/2, а ожидаемое число Fb рав­ няется (Fa + Fb)/2. Поскольку мы можем выбрать толь­ ко одно число, то имеем только одну степень свободы и выражение для х2принимает следующий вид1:

..2

\Fа - (Fa + F6)/2p

^

[Fb - (Fa + Fb)l

,ft оч

L ~

(Fa + Fb)l2

(Fa + Fb)l2

' • ■'

1 Обычно в случае одной степени свободы перед возведением в квадрат из каждого члена (О — Е) вычитают 0,5. В противном слу­ чае получается несколько большее значение х2» но Для большин­ ства инженерных вычислений получаемая ошибка невелика. Посколь­ ку редко бывает известно, с каким уровнем значимости должен быть получен результат, то в рассматриваемых далее примерах эта 1е5ольшая поправка не вводится.

Производится эксперимент по хронометрированию. Пер­ вая смена снимает половину всех данных иделает Ni ошибок; вторая смена снимает третью часть всех данных и делает N2 ошибок, а третья смена снимает шестую часть всех данных и допускает N3 ошибок. Всего сделано N ошибок, и необходимо проверить гипотезу о том, что смены не от­ личаются друг от друга по допускаемым ошибкам. Если такая гипотеза верна, то выбранное ожидаемое число ошибок для первой смены составит N/2 , так как снятие половины отсчетов означает, что в первой смене будет сделана половина всех ошибок. Для второй смены ожи­ даемое число ошибок принимается равным N/3, при этом для третьей смены остается N/ 6 ошибок, поскольку сумма

всех ошибок должна быть равна N. Таким

образом, здесь

число степеней свободы равно двум

и

выражение для

X2 принимает вид

 

 

 

 

 

- a _

( A T i - W

,

( Л Г . - Л Г / З ) »

 

(Л Г , — Л Г / 6 ) » !

л —

N12

"•

N13

N/ 6

Иногда полученные данные относятся к двум совокуп­ ностям или множествам событий, отличающихся друг от друга некоторым показателем, и нас интересует, имеют ли в этих двух случаях отказы или неисправности значи­ мые различия. Пусть имеются образцы поверхностно упрочненной стали (марка А) и обыкновенной стали (мар­ ка В). Наиболее удобно представить данные в виде сле­ дующей таблицы:

Эмпирические данные

 

П ринято

Забраковано

Всего

Поверхностно упрочнен-

А X

X

А

ная сталь

В Y

Y

В

Обыкновенная сталь

Всего

А -f B — X — Y

X + Y

А + В

Если рассматривается гипотеза: «Поверхностное упроч­ нение стали не оказывает влияния на ее прочность», то

таблица, содержащая математические ожидания всех элементов, будет иметь следующий вид:

Ожидаемые результаты

П ринято Забраковано Всего

Поверхностно

 

 

 

 

упрочненная

^ А + В ^ ^ ^

л + *<* +

у >

А

сталь

 

Обыкновенная

в-лТв^х + Г)

* +*<*+•'>

В

сталь

 

Всего

A + B - X - Y

X + Y

 

А + В

Заметим, что в таблице для ожидаемых результатов все четыре суммы должны быть такими же, как и в таб­ лице для эмпирических данных. Исследование показы­ вает, что это ограничение позволяет выбрать только один из четырех элементов таблицы, а когда этот один элемент выбран, фиксированные суммы позволяют определить значения трех остальных элементов. В данном случае имеем одну степень свободы и х2 находится по формуле (8 .1 ) путем суммирования четырех членов, определяемых

спомощью элементов таблицы для эмпирических данных

итаблицы для ожидаемых результатов.

После того как читатель получит две важные величи­ ны — число степеней свободы и значение х2. он должен с помощью соответствующей таблицы1 или графика на фиг. 8 . 1 найти вероятность того, что значение х2 не мень­ ше найденного. Если эта вероятность равна, например, 10, 20 или 30%, то это означает, что данная гипотеза приемлема (хотя и не доказана). В любом случае такое значение вероятности показывает, что данные, получен­ ные в эксперименте, и данные, основанные на гипотезе, не принадлежат различным совокупностям. С другой стороны, вероятность, равная 5%, вызывает сомнение в справедливости сформулированной гипотезы. Например, вероятность, равная 0,05, показывает, что полученные

1 См., например, [2].

Фи г . 8.1. График значений х2 какфункции числа степеней сво­ боды для различных значений вероятности появления данного зна­ чения х2Нулевое число степеней свободы не рассматривается.

данные или данные, имеющие еще большее расхождение, могут не соответствовать гипотетическому распределению не менее чем в одном случае из двадцати. При уровне значимостиу равном 1 %, это событие возможно лишь в одном случае из ста и т. д. Правильный выбор уровня

значимости — это сложный вопрос, который зависит от характера эксперимента, его назначения и объема имею­ щихся данных. Вообще говоря, при 5%-ном уровне значимости могут возникать сомнения, а при 7%-ном наше знание приближается к достоверности. Заметим, что чаще всего мы пытаемся отклонить сформулированную гипо­ тезу. Допустим, что в первом из трех примеров (где рассмат­ риваются маломощные двигатели) был зарегистрирован выход из строя пяти двигателей фирмы А и девяти двига­ телей фирмы В. В этом случае формула (8.2) принимает вид

7 2 -

(5 -7 ) 2

( 9 — 7)г

= 1,14.

* —

7

7

 

С помощью графика, изображенного на фиг. 8.1, при данном значении х2 и числе степеней свободы п = 1 на­ ходим, что вероятность определенно выше 1 0%, и наша гипотеза не отвергается. Допустим, что некоторое время спустя отношение числа отказов двигателя А к числу от­ казов двигателя В сохраняется неизменным, и мы наблю­ даем 15 отказов двигателя Л и 27 отказов двигателя В. В этом случае значение у 2 составляет 3,43, число степеней свободы остается неизменным и вероятность появления данного (или большего) значения х2 уменьшается почти до 5%. Хотя это и не означает, что наша гипотеза досто­ верно отклоняется, все же следует проявлять осмотри­ тельность. Появление при последующей эксплуатации отказов, имеющих такую же интенсивность, увеличивает уверенность, что сформулированная гипотеза лож­ на, и позволяет убедиться в том, о чем мы все время дога­ дывались, а именно в том, что двигатели фирмы А лучше1. Таким образом, критерий х2 весьма чувствителен к объему выборки, и часто для получения действительно значимого результата необходимо иметь большой объем данных.

1) З д есь

предп ол агается, что испы тания двигателей п р ои зв одя т ­

ся с заменой,

т. е. когда двигатель вы ходит из стр оя , он н ем едл енн о

рем онтируется

и возвращ ается

в экспл уатацию , так что оди н ак овое

соотнош ение (1

: 1) сохр ан яется

все врем я. Е сли бы неисправны е дви ­

гатели

не зам енял ись

или не

рем онтировались, то п остеп ен н о дв и ­

гателей

А стал о бы зн ачи тел ьн о бол ьш е и их интенсивность вы хода

из строя

п о

сравнению

с двигателям и В ув еличилась бы. Этот с л у ­

чай является

слиш ком

слож ны м для такой элем ентарной задачи.

Необходимо предупредить и еще об одной особенности.

Минимальное ожидаемое число событий одного рода рав­ няется пяти. Так, если число отказавших двигателей + В) меньше десяти, то нельзя использовать крите­ рий х2* Эта и некоторые другие особенности применения критерия х2 рассматриваются в следующем примере.

Пример 8 .1 . В приведенной ниже таблице сравнивают­ ся проценты трещин в горных породах, железных дорог и каналов, образующих узлы с определенным числом тре­ щин, дорог, каналов. Исследовались аэрофотоснимки с изображением трещин в известняковых породах в пусты­ не Сахара, карта железных дорог штата Огайо и карта астронома Трамплера с изображением марсианских кана­ лов. На карте Трамплера имеется 158 таких узлов.

Число

трещ ин, железных

Трещины в

Железные дороги

[^Каналы на карте

дорог и каналов,

пустыне

в штате Огайо, %

Трамплера, %

образующих узлы

Сахара, %

 

 

 

1

 

2 3

,3

1 ,4

8 ,2

2

 

*

 

»

 

3

 

5 1

,2

10,9

2 0

,5

4

 

19,9

4 7 ,2

4 2 ,9

5

 

4

,1

13 ,7

1 6 ,3

6

 

0 ,7

9 ,0

8

,2

7

 

0

,0

5 ,8

3

,5

8 и

более

0

,7

1 2 ,0

0

,4

* Данные не рассматривались.

Одна трещина (дорога, канал) на узел означает, что эта трещина (дорога, канал) заканчивается. Узел двух трещин (дорог, каналов) не рассматривался, так как для трещин в Сахаре и марсианских каналов невозможно сказать, действительно ли это узлы или просто крутые изломы непрерывной линии. Согласно этой таблице1, распределение железных дорог в штате Огайо является типичным распределением коммуникаций (например, мар­ шрутов воздушного сообщения, автомобильных дорог и т. д.), в то время как распределение трещин в пустыне Сахара является типичным распределением естественных

1 См. S ci. M onthly, N ovem b er 1957, р р . 268 — 271 .