книги / Теория инженерного эксперимента
..pdfСТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ
Теперь, когда мы накопили достаточное количество данных, упорядочили их и отсеяли ошибочные результа ты, можно приступить к их анализу. В технике такой анализ может проводиться в форме обработки данных (data reduction), построения графиков и исследования численными или аналитическими методами. В последние годы инженеры-механики, инженеры-электротехники и инженеры-строители стали понимать, что возможно и желательно статистическое исследование получаемых ре зультатов. В тех случаях, когда вследствие больших за трат или выхода аппаратуры из строя не удается в до статочной степени контролировать эксперимент или полу чить необходимый объем данных, общие статистические выводы могут оказаться единственным возможным ко нечным продуктом. Вдругих случаях статистические выво ды могут дополнять обычный инженерный график или таблицу результатов.
Это очень обширная тема, поэтому автор позаимство вал из фундаментальных работ по математической стати стике лишь некоторые идеи, которые находят наиболее широкое применение в обычной инженерной практике. Необходимо иметь в виду, что существуют значительно более сложные, более изящные и более эффективные методы, чем те, которые будут описаны в данной главе. В большинстве случаев для применения этих более со вершенных методов требуются специальные таблицы, осо бые приготовления и обширные вычисления. Именно по этой причине в промышленных и научных организациях из года в год увеличивается количество специалистов в области математической статистики.
В данной главе будут рассмотрены методы, позволяю щие ответить на следующие простые и важные вопросы.
10—108
Если имеется две или большее число групп данных, то принадлежат ли они одной и той же совокупности? Если наблюдается ряд событий, то являются ли они результа том действия большого числа случайных факторов или же их распределение во времени и пространстве подчи няется определенной схеме? Читателю не представляет труда убедиться в том, что эти вопросы имеют отношение к огромному множеству важных инженерных эксперимен тов.
8.1. Терминология: два вида ошибок статистического вывода
В гл. 2 были рассмотрены такие важные понятия и термины, как генеральная совокупность и выборка, нор мальный закон, среднее квадратическое отклонение, сред нее значение и т. д. Большинство этих терминов является статистическими понятиями. Теперь используем понятия математической статистики не для обнаружения и описа ния случайных ошибок в измерительных приборах, а как средство анализа всего эксперимента, поэтому необ ходимо ввести некоторые дополнительные термины. Наи более важным является такое понятие, как значимость эксперимента или результатов эксперимента. Можно утверждать, что эксперимент, в котором 2 0 образцов стали марки А разрушились при давлении 4200 ±
± 350 кГ/см2, а 20 образцов стали марки В разрушились при давлении 5600 ± 350 кГ/см2, является высокозначи мым, поскольку он доказывает, что сталь марки В имеет более высокую прочность. Математик не станет возра жать против этого мнения, хотя он может порекомендо вать провести проверку значимости, которая позволила бы представить этот высокозначимый результат в виде некоторого числа. Если бы у 20 образцов стали марки В прочность оказалась равной 4430 ± 350 кГ/см2, то мы выразили бы сомнение в том, является ли сталь марки В более прочной, и статистический метод проверки был бы более необходим. При выполнении статистических прове рок, ряд которых будет описан в последующих разделах, рассматривается возможность появления двух типов оши бок статистического вывода. Ошибка первого рода имеет место, когда мы приписываем наблюдаемым различиям
некоторый реальный эффект, а в действительности ника кого эффекта нет. Так, можно утверждать, что сталь марки В (с прочностью 4430 ±350 кГ/см2) определенно прочнее стали марки А, и приступить к закупкам и использова нию только стали марки В. Последующие исследования (на более крупных выборках) могут показать, что между этими марками стали по существу нет различия, так что, выбрав на основе первоначальной выборки из 2 0 образцов сталь марки В, мы допустили ошибку первого рода. Для уменьшения вероятности ошибки первого рода необхо димо, чтобы результаты испытаний имели высокую зна чимость, но тогда увеличивается риск появления ошибки второго рода, которая имеет место, когда игнорируется реальный эффект или различие, которое в действительности существует. Например, можно решить, что различие между марками стали А и В не является значимым, и применять обе марки, не проводя между ними различий. Последую щие испытания могут показать, что сталь марки В несом ненно прочнее, чем сталь марки А, и что нами допущена ошибка второго рода.
Эти идеи могут показаться довольно очевидными, одна ко они освещают некоторые существенные аспекты ста тистического вывода, играющие особенно важную роль при решении инженерных задач. Большинство инженер ных экспериментов приводит в конечном счете к тому или иному действию, и нет какого-либо определенного правила, устанавливающего нежелательность ошибок пер вого рода по сравнению с ошибками второго рода. Если испытывается устройство раскрытия парашюта, то про стые соображения гуманности заставляют избегать воз можности появления ошибки второго рода (которая со стоит в том, что не будет выбрано действительно наилуч шее устройство), в то время как ошибка первого рода (выбор наиболее дорогого устройства, которое кажется надежнее других) не является столь серьезной. И наобо рот, если из большой группы реле требуется выбрать реле для установки на дешевую детскую игрушку, то ошибка второго рода (состоящая в том, что не будет выбрано са мое лучшее реле), по-видимому, не столь серьезна, как ошибка первого рода (выбор реле определенной конструк ции, которое в действительности не лучше других, но бо
лее дорогое). Эти идеи станут яснее после того, как мы рассмотрим в последующих двух разделах конкретные методы и проблемы.
8.2. Проверка значимости с помощью у2-критерия
Во многих случаях данные, получаемые в эксперимен те, представляют собой число объектов. Например, опре деленное число деталей может быть принято или забра ковано при приемке, пройти испытания на долговечность или выйти из строя до их завершения, продано или воз вращено обратно. При приемке может быть пропущено некоторое число бракованных деталей и обнаружены дефекты у некоторых других либо может быть забрако вано некоторое число исправных деталей и принято неко торое другое число исправных деталей. Может рассматри ваться число деталей, изготовленных за данную смену или определенным рабочим, либо на данном станке или сбо рочной линии, либо с помощью некоторого производствен ного метода и т. д. Счет числа частиц космического излу чения, числа испытаний, числа автомобилей, числа карто чек, угадываемых на парапсихологическом сеансе, мо жет давать разные результаты в различные дни недели, различные смены, в различных местах и для различных лиц. Многие испытания такого рода можно проверять на значимость с помощью у2 -критерия.
Вывод распределения у2 (которое по форме несколько отличается от нормального распределения, рассмотренного в гл. 2 ) здесь не дается, однако он приводится во многих книгах по математической статистике (см., например, [111). Вычислим вначале у2 по формуле
(8. 1)
где О обозначает наблюдаемое число событий (например, отказов, реализованных товаров, забракованных изде лий, изготовленных предметов, зарегистрированных ча стиц, правильных ответов и т. д.), а Е — математическое ожидание числа этих событий. Когда мы говорим о мате матическом ожидании, то вводим гипотезу, которая может
быть истинной или ложной. Допустим, например, что необходимо узнать, на каком токарном станке — новом или старом — мы получим больше хороших деталей. Для этого на каждом станке изготавливается одинаковое число деталей и проверяемая гипотеза гласит: «Оба стан ка выпускают одинаковое число хороших деталей». Или же на основе предыдущего опыта можно сказать: «Яа новом станке получаем хороших деталей на одну треть больше, чем на старом». Каждую из этих гипотез можно проверить, вычислив соответствующее значение х2- Од нако, прежде чем показать, как это делается, необходимо рассмотреть еще один новый термин. При любом — таб личном или графическом — представлении распределе ния х2 необходимо знать число степеней свободы, связан ных с экспериментом. Число степеней свободы — это число независимых групп наблюдений, охватываемых гипотезой. Это понятие всегда несколько пугает начи нающих исследователей, поэтому стоит привести некото рые примеры.
Допустим, что отдел закупок приобрел маломощные двигатели — половину в фирме А и половину в фирме В. Через некоторый промежуток времени вышли из строя Fa двигателей фирмы А и Fb двигателей фирмы В. Общее
число неисправных |
двигателей |
постоянно |
и равно |
(Ра + Fb). Допустим |
теперь, что |
требуется |
проверить |
гипотезу, согласно которой число отказавших двигателей обеих фирм одинаково. Тогда ожидаемое число Fa можно принять равным (Fa + Fb)/2, а ожидаемое число Fb рав няется (Fa + Fb)/2. Поскольку мы можем выбрать толь ко одно число, то имеем только одну степень свободы и выражение для х2принимает следующий вид1:
..2 |
\Fа - (Fa + F6)/2p |
^ |
[Fb - (Fa + Fb)l2р |
,ft оч |
L ~ |
(Fa + Fb)l2 |
(Fa + Fb)l2 |
' • ■' |
1 Обычно в случае одной степени свободы перед возведением в квадрат из каждого члена (О — Е) вычитают 0,5. В противном слу чае получается несколько большее значение х2» но Для большин ства инженерных вычислений получаемая ошибка невелика. Посколь ку редко бывает известно, с каким уровнем значимости должен быть получен результат, то в рассматриваемых далее примерах эта 1е5ольшая поправка не вводится.
Производится эксперимент по хронометрированию. Пер вая смена снимает половину всех данных иделает Ni ошибок; вторая смена снимает третью часть всех данных и делает N2 ошибок, а третья смена снимает шестую часть всех данных и допускает N3 ошибок. Всего сделано N ошибок, и необходимо проверить гипотезу о том, что смены не от личаются друг от друга по допускаемым ошибкам. Если такая гипотеза верна, то выбранное ожидаемое число ошибок для первой смены составит N/2 , так как снятие половины отсчетов означает, что в первой смене будет сделана половина всех ошибок. Для второй смены ожи даемое число ошибок принимается равным N/3, при этом для третьей смены остается N/ 6 ошибок, поскольку сумма
всех ошибок должна быть равна N. Таким |
образом, здесь |
|||||
число степеней свободы равно двум |
и |
выражение для |
||||
X2 принимает вид |
|
|
|
|
|
|
- a _ |
( A T i - W |
, |
( Л Г . - Л Г / З ) » |
|
(Л Г , — Л Г / 6 ) » ! |
|
л — |
N12 |
"• |
N13 |
-г |
N/ 6 |
Иногда полученные данные относятся к двум совокуп ностям или множествам событий, отличающихся друг от друга некоторым показателем, и нас интересует, имеют ли в этих двух случаях отказы или неисправности значи мые различия. Пусть имеются образцы поверхностно упрочненной стали (марка А) и обыкновенной стали (мар ка В). Наиболее удобно представить данные в виде сле дующей таблицы:
Эмпирические данные
|
П ринято |
Забраковано |
Всего |
Поверхностно упрочнен- |
А — X |
X |
А |
ная сталь |
В — Y |
Y |
В |
Обыкновенная сталь |
|||
Всего |
А -f B — X — Y |
X + Y |
А + В |
Если рассматривается гипотеза: «Поверхностное упроч нение стали не оказывает влияния на ее прочность», то
таблица, содержащая математические ожидания всех элементов, будет иметь следующий вид:
Ожидаемые результаты
П ринято Забраковано Всего
Поверхностно |
|
|
|
|
упрочненная |
^ А + В ^ ^ ^ |
л + *<* + |
у > |
А |
сталь |
|
|||
Обыкновенная |
в-лТв^х + Г) |
* +*<*+•'> |
В |
|
сталь |
|
|||
Всего |
A + B - X - Y |
X + Y |
|
А + В |
Заметим, что в таблице для ожидаемых результатов все четыре суммы должны быть такими же, как и в таб лице для эмпирических данных. Исследование показы вает, что это ограничение позволяет выбрать только один из четырех элементов таблицы, а когда этот один элемент выбран, фиксированные суммы позволяют определить значения трех остальных элементов. В данном случае имеем одну степень свободы и х2 находится по формуле (8 .1 ) путем суммирования четырех членов, определяемых
спомощью элементов таблицы для эмпирических данных
итаблицы для ожидаемых результатов.
После того как читатель получит две важные величи ны — число степеней свободы и значение х2. он должен с помощью соответствующей таблицы1 или графика на фиг. 8 . 1 найти вероятность того, что значение х2 не мень ше найденного. Если эта вероятность равна, например, 10, 20 или 30%, то это означает, что данная гипотеза приемлема (хотя и не доказана). В любом случае такое значение вероятности показывает, что данные, получен ные в эксперименте, и данные, основанные на гипотезе, не принадлежат различным совокупностям. С другой стороны, вероятность, равная 5%, вызывает сомнение в справедливости сформулированной гипотезы. Например, вероятность, равная 0,05, показывает, что полученные
1 См., например, [2].
Фи г . 8.1. График значений х2 какфункции числа степеней сво боды для различных значений вероятности появления данного зна чения х2Нулевое число степеней свободы не рассматривается.
данные или данные, имеющие еще большее расхождение, могут не соответствовать гипотетическому распределению не менее чем в одном случае из двадцати. При уровне значимостиу равном 1 %, это событие возможно лишь в одном случае из ста и т. д. Правильный выбор уровня
значимости — это сложный вопрос, который зависит от характера эксперимента, его назначения и объема имею щихся данных. Вообще говоря, при 5%-ном уровне значимости могут возникать сомнения, а при 7%-ном наше знание приближается к достоверности. Заметим, что чаще всего мы пытаемся отклонить сформулированную гипо тезу. Допустим, что в первом из трех примеров (где рассмат риваются маломощные двигатели) был зарегистрирован выход из строя пяти двигателей фирмы А и девяти двига телей фирмы В. В этом случае формула (8.2) принимает вид
7 2 - |
(5 -7 ) 2 |
( 9 — 7)г |
= 1,14. |
|
* — |
7 |
7 |
||
|
С помощью графика, изображенного на фиг. 8.1, при данном значении х2 и числе степеней свободы п = 1 на ходим, что вероятность определенно выше 1 0%, и наша гипотеза не отвергается. Допустим, что некоторое время спустя отношение числа отказов двигателя А к числу от казов двигателя В сохраняется неизменным, и мы наблю даем 15 отказов двигателя Л и 27 отказов двигателя В. В этом случае значение у 2 составляет 3,43, число степеней свободы остается неизменным и вероятность появления данного (или большего) значения х2 уменьшается почти до 5%. Хотя это и не означает, что наша гипотеза досто верно отклоняется, все же следует проявлять осмотри тельность. Появление при последующей эксплуатации отказов, имеющих такую же интенсивность, увеличивает уверенность, что сформулированная гипотеза лож на, и позволяет убедиться в том, о чем мы все время дога дывались, а именно в том, что двигатели фирмы А лучше1. Таким образом, критерий х2 весьма чувствителен к объему выборки, и часто для получения действительно значимого результата необходимо иметь большой объем данных.
1) З д есь |
предп ол агается, что испы тания двигателей п р ои зв одя т |
||||
ся с заменой, |
т. е. когда двигатель вы ходит из стр оя , он н ем едл енн о |
||||
рем онтируется |
и возвращ ается |
в экспл уатацию , так что оди н ак овое |
|||
соотнош ение (1 |
: 1) сохр ан яется |
все врем я. Е сли бы неисправны е дви |
|||
гатели |
не зам енял ись |
или не |
рем онтировались, то п остеп ен н о дв и |
||
гателей |
А стал о бы зн ачи тел ьн о бол ьш е и их интенсивность вы хода |
||||
из строя |
п о |
сравнению |
с двигателям и В ув еличилась бы. Этот с л у |
||
чай является |
слиш ком |
слож ны м для такой элем ентарной задачи. |
Необходимо предупредить и еще об одной особенности.
Минимальное ожидаемое число событий одного рода рав няется пяти. Так, если число отказавших двигателей (А + В) меньше десяти, то нельзя использовать крите рий х2* Эта и некоторые другие особенности применения критерия х2 рассматриваются в следующем примере.
Пример 8 .1 . В приведенной ниже таблице сравнивают ся проценты трещин в горных породах, железных дорог и каналов, образующих узлы с определенным числом тре щин, дорог, каналов. Исследовались аэрофотоснимки с изображением трещин в известняковых породах в пусты не Сахара, карта железных дорог штата Огайо и карта астронома Трамплера с изображением марсианских кана лов. На карте Трамплера имеется 158 таких узлов.
Число |
трещ ин, железных |
Трещины в |
Железные дороги |
[^Каналы на карте |
|||
дорог и каналов, |
пустыне |
в штате Огайо, % |
Трамплера, % |
||||
образующих узлы |
Сахара, % |
||||||
|
|
|
|||||
1 |
|
2 3 |
,3 |
1 ,4 |
8 ,2 |
||
2 |
|
* |
|
» |
|
||
3 |
|
5 1 |
,2 |
10,9 |
2 0 |
,5 |
|
4 |
|
19,9 |
4 7 ,2 |
4 2 ,9 |
|||
5 |
|
4 |
,1 |
13 ,7 |
1 6 ,3 |
||
6 |
|
0 ,7 |
9 ,0 |
8 |
,2 |
||
7 |
|
0 |
,0 |
5 ,8 |
3 |
,5 |
|
8 и |
более |
0 |
,7 |
1 2 ,0 |
0 |
,4 |
* Данные не рассматривались.
Одна трещина (дорога, канал) на узел означает, что эта трещина (дорога, канал) заканчивается. Узел двух трещин (дорог, каналов) не рассматривался, так как для трещин в Сахаре и марсианских каналов невозможно сказать, действительно ли это узлы или просто крутые изломы непрерывной линии. Согласно этой таблице1, распределение железных дорог в штате Огайо является типичным распределением коммуникаций (например, мар шрутов воздушного сообщения, автомобильных дорог и т. д.), в то время как распределение трещин в пустыне Сахара является типичным распределением естественных
1 См. S ci. M onthly, N ovem b er 1957, р р . 268 — 271 .