Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы моделирования в геологии

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
8.18 Mб
Скачать

Доверительная вероятность обычно задается близкой к 1 (/' = 0,95; 0,98; 0,99; 0,999):

j = 1 ~ а,

где а - уровень значимости или вероятность ошибки; а определяет вероятность того, что истинное значение окажется за пределами интервала.

Доверительная вероятность у, точность оценки А. и N связаны между собой: если определены две величины, то можно определить и третью.

Доверительные границы могут быть односторонними и двусто­ ронними. В этом случае говорят об одноили двустороннем уровне значимости а. Для одной доверительной вероятности а существует множество оценок Т. Для достижения однозначности вводят допол­ нительные ограничения на пределы, то есть указывают, о каком пределе - верхнем или нижнем - идет речь:

У = Р г ~ рй

рг

2.4. Основные статистические законы распределения, используемые в геологии

В большинстве случаев для непрерывных величин используют нормальный или логнормальный закон; для дискретных величин применяются биномиальный закон Пуассона. Для угловых величин пользуются законом Мизеса.

Закон Гаусса является фундаментальным в теории вероятности. Нормальное распределение наиболее часто встречается в природ­ ных явлениях. Его особенность в том, что он является законом пре­ дела, к которому стремятся все другие законы распределения при определенных условиях, например при увеличении объема выбор­ ки. Нормальное распределение непрерывно, и определяется оно двумя параметрами: Мх и дисперсией:

N = ( Мх, а2).

Функция распределения имеет вид:

 

х

(х -М х )

F(x) =

je

2<j2 d x

Функция плотности такого распределения:

(х-А/х)

2ст2

/(* ) =

График плотности нормального распределения называется нормальной кривой, или кривой Гаусса.

Нормальное распределение симметрично относительно Мх, следовательно Мл, Мо и Me совпадают.

Свойства нормального закона:

1.Кривая плотности распределения достигает максимума в точ­ ке л = Мл.

2.Кривая плотности распределения симметрична относительно

Мл.

3.Максимальная ордината.

4.Функция плотности распределения имеет форму колокола. Кривая имеет форму колокола выпуклостью вверх. Чем больше

среднеквадратичное отклонение, тем колокол шире; чем оно мень­ ше, тем колокол острее.

В условиях нормального закона вероятность значений, отли­ чающихся от Мл больше чем на три стандартных отклонения, очень мала. Попадание их в выборку ограниченного объема можно счи­ тать событием практически невозможным. Большинство значений (95 %) будет находиться в интервале Мл ± 2а.

Правило За: если случайная величина распределения нормаль­ на, то абсолютная величина ее отклонения от Мл не превосходит трех среднеквадратичных отклонений:

(л - Мл) < За.

Это правило применяют на практике для любого симметрично­ го распределения, например, при определении

-случайных технических погрешностей измерений и анализов

проб;

-содержания некоторых полезных компонентов в рудах;

-содержания породообразующих минералов;

-физико-механических свойств пород (плотность, пористость, объемная масса);

-нефтегазонасыщенности;

-эффективных мощностей тел полезного ископаемого.

Путем преобразований, при определенных условиях, к нор­ мальному закону сводятся все другие законы распределения.

Логарифмически нормальным (логнормальным) называют за­ кон, при котором нормально распределены логарифмы значений случайной величины, причем распределение является положитель­ но асимметричным и имеет положительный эксцесс.

Так, логнормальному распределению подчиняются диаметры частиц при дроблении пород (это подтвердилось гранулометриче­ ским анализом), а также удельное электрическое сопротивление горных пород р, проницаемость горных пород Кпри оценка запасов месторождений полезных ископаемых.

Биномиальное распределение используют, когда при проведе­ нии испытаний наблюдается одно из двух событий. Например, при разведке нефтяных структур путем бурения скважин по определен­ ной сети каждая скважина может либо пересечь нефтяную структу­ ру (событие А), либо не попасть в нее (событие В). Соотношение числа скважин, вскрывших нефтяную структуру т, к общему числу скважин в контуре п:

К = min,

где К - коэффициент успешности.

Вероятность появления тех или иных значений выражается формулой

Р(» = С > '" (1-Р ) " Л

где Рп- вероятность того, что при количестве испытаний п собы­ тие А произойдет т раз;

р - вероятность события А; С'п - число сочетаний из п по х.

Совокупность вероятностей рп(т) при m = О, 1, 2..., п называет­ ся биномиальным распределением. Сумма всех возможных значений Рп(м) равна 1.

Величина С ”1 называется биномиальным коэффициентом, а ве­

личина п и P-параметрами биномиального распределения. Биномиальный закон применяется:

-при анализе частоты встречаемости ископаемых организмов определенного вида в различных горизонтах осадочных пород;

-при анализе количества различных минералов в шлифах;

-при анализе случаев аварий и производственного травматиз­ ма во время проведения геологоразведочных работ.

Распределение Пуассона используется, когда число испытаний велико: вероятность появления случайного события в каждом испы­ тании мала.

Рп(т) = е~х /т\,

где X - среднее число появления события А в п испытаниях.

Для распределения Пуассона X и дисперсия совпадают. Распре­ деление Пуассона применяется:

-для описания процессов радиоактивного распада химических элементов;

-для описания вероятности встречи в пробах крупных алмазов

исамородков золота;

-при анализе вероятности обнаружения выходов тел полезных ископаемых во время проведения поисковых работ.

Распределение Стьюдента t используют при проверке гипотез

оравенстве средних значений геологических характеристик, при определении значимости коэффициента корреляции. Распределе­ ние Стьюдента t - подчиняется расположению обломочных частиц в аллювиальных отложениях.

Экспоненциальным (показательным) называется распределение

случайной величины, которая описывается плотностью

где р - постоянная величина, которая задается по конкретной выборке;

$ - убывающая экспоненциальная функция. Экспоненциальное распределение определяется одним пара­

метром Р, и в этом его преимущество. Оно применяется, например, при подсчете запасов полезных ископаемых. Этому распределению подчиняются размеры частиц в нормально морских терригенных отложениях.

Распределение Лапласа (двустороннее) используется при под­ счете запасов полезных ископаемых

лчл- 0 ,при лг < О

Равномерное распределение используют для замеров ориенти­ ровки обломков в делювиальных отложениях и в вулканических брекчиях.

При изучении распределений угловых величин используется равномерное распределение Мизеса.

Оно применяется для определения точечных и интервальных оценок угловых величин.

Распределение Мизеса определяется двумя параметрами:

- р - круговое среднее направление случайной угловой вели­ чины, схожей с MJC;

- к - характеристика концентрации около р, то есть схожей с дисперсией.

Распределение Мизеса аналогично нормальному. Оно одномо­ дально и симметрично.

2.5. Статистическая проверка геологических гипотез

Решение многих геологических задач основано на принципе аналогии, когда для объяснения особенностей строения слабо изу­ ченных объектов используют закономерности, установленные при изучении аналогичных объектов. Для правильного выбора объектааналога необходимо оценить степень его сходства с исследуемым объектом.

В других случаях, (например, при интерпретации многих гео­ физических данных) возникает необходимость оценить степень раз­ личия геологических объектов по тем или иным физическим свой­ ствам.

Для объективного решения вопроса о сходстве или различии геологических объектов используются статистические методы про­ верки гипотез о равенстве числовых характеристик их свойств. В геологической практике чаще всего эти методы применяются для суждения:

-о равенстве средних значений изучаемого признака, получен­ ных разными методами для одного и того же объекта или одним методом для различных объектов;

-о равенстве дисперсий двух случайных величин по выбороч­ ным данным;

-об однородности изучаемого объекта.

 

Статистическая проверка гипотез производится с помощью

критериев согласия.

 

Критерием согласия называется значение некоторой функции

К =

Х2, Х п), где Х\, Х2, Х п- случайные величины, характе­

ризующие проверяемую гипотезу. Функция выбирается таким обра­ зом, чтобы в случае правильности проверяемой гипотезы ее значе­ ния представляли бы собой случайную величину с заранее извест­ ным распределением.

Проверяемая гипотеза принимается, если значение К, вычис­ ленное через выборочные значения величин Х\9Х2у ..., Хт окажется меньше или больше (в зависимости от формулировки гипотезы) теоретического значения К для аналогичных условий и заданной вероятности а, которое берется по известному распределению. Ве­ роятность а при этом соответствует уровню вероятности практиче­ ски невозможного события и называется уровнем значимости.

Соответственно вероятность (1 - а ), определяющая область, в пределах которой правильность принятого решения будет практи­ чески достоверным событием, называется доверительной.

Ошибка, заключенная в непринятии гипотезы, в действитель­ ности являющейся справедливой, называется ошибкой первого рода, а принятие ложной гипотезы - ошибкой второго рода.

Если вероятность ошибки второго рода обозначить через Р, то (1 —Р), то есть вероятность отсутствия такой ошибки, будет вели­ чиной, называемой мощностью данного критерия относительно конкурирующей гипотезы.

Увеличение доверительной вероятности (уменьшение уровня значимости) снижает вероятность ошибки первого рода, но увели­ чивает вероятность ошибки второго рода.

Область применения определенных критериев согласия обычно ограничивается некоторыми условиями, а их мощность зависит от характера конкурирующей (альтернативной) гипотезы и объема вы­ борки.

Для решения задач на основе статистической проверки гипотез геолог должен выполнить следующие операции:

-четко сформулировать проверяемую (Я0) и альтернативную (Н\) гипотезу, исходя из существа поставленной геологической за­ дачи;

-выбрать наиболее мощный при данном объеме выборки кри­ терий, условия применения которого не противоречат свойствам изучаемых случайных величин;

-оценить последствия ошибки первого и второго рода в усло­ виях решаемой геологической задачи и выбрать уровень значимо­ сти исходя из требования минимизации ущерба в результате непра­ вильного решения;

- рассчитать эмпирическое значение критерия согласия К по выборочным данным, сравнить его с теоретическим значением К для принятого уровня значимости и принять решение относительно гипотезы Но]

- интерпретировать полученный результат применительно к поставленной геологической задаче.

При формулировке проверяемой гипотезы Нотрудностей обычно

не возникает, однако вопрос о том, какую гипотезу

принять

в качестве альтернативной, не всегда решается однозначно,

гак как

для одной и той же гипотезы Но может существовать несколько аль­ тернативных гипотез Н\. Например, при расчете интервальных оце­ нок гипотеза Но заключается в том, что неизвестное математическое ожидание Мх находится в определенном интервале значений, то есть

Но'. х-А.<Мх<х + Я,.

В то же время в качестве альтернативных могут выступать раз­ ные гипотезы:

-математическое ожидание меньше нижней границы довери­ тельного интервала, то есть

Н\:х - Х > М х ;

-математическое ожидание больше верхней границы довери­ тельного интервала, то есть

Н\ :х +Х>Мх;

- математическое ожидание больше верхней или меньше ниж­ ней границы доверительного интервала, то есть

Hf :х - Х>Мх < х +А,.

В рассмотренных выше примерах в качестве альтернативной

принималась гипотеза Н] Однако при подсчете запасов месторож­ дений часто целесообразнее пользоваться альтернативной гипоте­

зой Н \ , так как вопрос о возможности промышленного использова­ ния определенных объемов руды решается путем сравнения полу­ ченных иных оценок среднего содержания полезного компонента с минимальным промышленным содержанием.

Неправильная формулировка альтернативной гипотезы может вызвать ошибки при пользовании статистическими таблицами, по­ скольку существуют таблицы для критериев двух типов - односто­ ронних и двусторонних. В таблицах односторонних критериев при­ водятся доверительные вероятности или уровни значимости, соот­

ветствующие простым альтернативным событиям типа Н\ или Н ]. Таблицы двусторонних критериев построены для сложных альтер­

натив типа Н j*, когда учитывается вероятность сразу двух событий.

Интегральная функция Лапласа относится к таблицам первого типа, поэтому при нахождении по ней вероятностного критерия Z для построения двустороннего доверительного интервала, то есть

при альтернативе Н j*, уровень значимости необходимо уменьшать в два раза. Таблицы второго типа строятся только для симметрично

распределенных критериев. Они более компактны и удобны для по­ строения доверительных интервалов и проверки гипотез при аль­

тернативах типа Н ] . Примером таблиц этого типа является таблица

двустороннего /-критерия Стьюдента. Используя эту таблицу для построения односторонних доверительных интервалов или провер­

ки гипотез при альтернативах типа Н\ или Н ] , значения функции

принимаются для уровня значимости 2 а.

Статистические критерии согласия разделяются на параметри­ ческие и непараметрические. Параметрические критерии выводят­ ся из свойств тех или иных статистических законов распределения и могут использоваться лишь в том случае, если распределение вы­ борочных данных согласуется с этим законом. Непараметрические критерии могут применяться даже в том случае, если закон распре­ деления изучаемых величин неизвестен или их распределения не соответствуют никакому из известных законов. Непараметри­ ческие критерии обычно обладают несколько меньшей мощностью по сравнению с параметрическими аналогами, но область их при­ менения значительно шире. Фактические распределения свойств геологических объектов часто отклоняются от теоретических, по­ этому геологи проявляют большой интерес к непараметрическим критериям.

Выбор уровня значимости при статистической проверке гипо­ тез является весьма важным, но отнюдь не всегда простым вопро­ сом. Он решается исключительно исходя из особенностей геологи­ ческой задачи на основе анализа возможных последствий от оши­ бок первого и второго рода. Для правильного выбора уровня значимости геологу необходимо четко представлять себе конечную цель проводимых исследований, а иногда даже выполнять ук­ рупненные технико-экономические расчеты для оценки возможного ущерба за счет принятия неправильного решения. В случае затруд­ нения с выбором уровня значимости гипотезу целесообразно прове­ рить при разных его значениях.

При интерпретации полученных результатов необходимо сле­ дить за тем, чтобы вывод по геологической задаче строго логически соответствовал проверяемой гипотезе HQ.

2.6. Проверка гипотез о равенстве средних

(математических ожиданий)

Необходимость сравнения средних значений изучаемых свойств геологических объектов возникает при решении широкого круга задач во всех отраслях геологических наук. Так, например, по мнению многих петрологов, средний химический состав лав вулка­ нов и интрузивных пород отражает в общих чертах особенности состава породивших их глубинных магматических очагов. Путем сравнения различных эффузивных и интрузивных пород по средне­ му содержанию в них химических элементов можно судить о комагматичности (то есть генетическом родстве) эффузивных и ин­ трузивных образований, о принадлежности интрузивных образова­ ний к определенному магматическому комплексу или двух вулканических построек к одному глубинному магматическому очагу.

Известно, что метаморфические породы характеризуются ус­ тойчивыми парагенетическими ассоциациями с небольшим (2—4) числом породообразующих минералов. Различия в наборе и про­ центных соотношениях этих минералов отражают различия в хими­ ческом составе исходных пород, претерпевших метаморфизм. Статистические методы проверки гипотезы о равенстве средних содержаний породообразующих минералов используются для стра­ тиграфического расчленения метаморфических комплексов и корреля­ ции их разрезов при детальном геологическом картировании.

Впалеонтологии статистические методы проверки гипотезы

оравенстве средних способствуют объективному разделению се­ мейств ископаемых организмов на виды. Для выделения нового ви­ да необходимо доказать, что данная группа ископаемых организмов существенно отличается по среднему значению какого-либо мор­ фологического признака, например по степени сферичности или углу между линиями замкового шва и краем вентрального синуса.

Впроцессе разведки месторождения о надежности выбранного способа отбора проб обычно судят по контрольным пробам, кото­ рые отбираются другим, более надежным способом, но, как прави­ ло, более трудоемким и дорогим. Проверка гипотезы о равенстве средних содержаний полезного компонента, рассчитанных по рядо­

Соседние файлы в папке книги