книги / Математические методы моделирования в геологии
..pdfРасчеты показывают, что различие в оценках коэффициентов рудоносности по двум уступам не очень существенно и может быть обусловлено малым количеством скважин на нижнем уступе, а не фактическим увеличением рудонасыщенности с глубиной.
2.7. Проверка гипотез о равенстве дисперсий
Сравнение геологических объектов по степени изменчивости, которая оценивается по величине дисперсии или коэффициента ва риации тех или иных свойств, необходимо для обоснованного при менения принципа аналогии при их изучении. Так, например, дис персия мощности рудных тел характеризует сложность их строения.
Различие в дисперсиях свойств аналогичных по составу геоло гических объектов может указывать и на различие в истории их формирования. Так, различие дисперсий содержаний основных по родообразующих минералов в двух схожих по составу комплексах магматических пород может указывать на то, что комплекс, для ко торого характерна большая степень рассеяния содержаний, форми ровался в течение более длительного периода, и в нем сильнее про явились процессы дифференциации.
Различные горные породы, сходные по средним значениям фи зических свойств - магнитной восприимчивости, электропроводи мости и т. п., часто отличаются по степени изменчивости этих свойств. Поэтому путем проверки гипотез о равенстве (различии) дисперсий можно проводить литологическое расчленение разрезов по данным геофизического каротажа скважин при бескерновом бу рении, а также интерпретировать результаты геофизических съемок при составлении геологических карт.
На сравнении дисперсий основаны также методы определения величин случайных погрешностей различных способов опробова ния и анализов. Если количественные данные о свойствах геологи ческого объекта получены различными способами, то более надеж ным следует признать тот из них, который дает меньший разброс значений изучаемого свойства, то есть характеризуется меньшей дисперсией.
Для проверки гипотезы о равенстве дисперсий of и <з\ обычно
используется критерий Фишера F. Р. Фишером было установлено,
что в случае равенства дисперсий двух нормально распределенных
случайных величин, величина F = 5,2 / S\ при «S'2 > распределена
по закону Фишера с щ - 1 и «г - 1 степенями свободы, где щ - ко личество членов в выборке, по которой получена большая оценка
дисперсии S f , а л2 —объем второй выборки. Процедура проверки гипотезы сводится к нахождению эмпирического значения F- критерия и сравнению его с табличным значением для принятой доверительной вероятности ( 1 —а) и степенях свободы f = и - 1 и f = «2 —1. Если вычисленное значение критерия Фишера превы шает табличное, то гипотеза о равенстве двух дисперсий отвергается.
В приложении приведены критические значения F-критерия
для уровня значимости а и альтернативной гипотезы |
//,: а 2 > . |
При сложной альтернативе Н\. af a 2, то есть |
af > ст2 или |
af <ст2 , критическое значение критерия Фишера находят для уров
ня значимости а/2 .
В условиях асимметричных распределений критерий Фишера обладает малой мощностью. В случае логнормального распределе ния сравниваемых совокупностей при использовании этого крите рия необходимо пользоваться максимально правдоподобными оценками дисперсий или проверять гипотезу о равенстве дисперсий логарифмов значений исследуемого признака.
Пример. Воспользуемся статистическими характеристиками, приведенными в табл. 3, и проверим гипотезу о равенстве диспер сий содержаний Na20, К20 и ТЮ2 в гранитах неизвестного воз раста и гранитах средне- и верхнепалеозойского комплексов при
альтернативе Н\ \ af Ф а\ и уровне значимости а/2 = 0,05.
Таблица 3 Исходные данные оценки рудоносности гранитов неизвестного
возраста (в %).
Возраст гранитов |
Число |
Ыа20 |
|
_____КгО_____ |
ТЮ2 |
|||
проб |
X |
S 2 |
X |
S 2 |
lg* |
с2 |
||
|
||||||||
Средний палеозой |
100 |
3,90 |
1,21 |
4,51 |
1,42 |
-0,886 |
0,268 |
|
Поздний палеозой |
100 |
3,46 |
1,52 |
5,02 |
1,65 |
-1,426 |
0,321 |
|
Неизвестен |
30 |
3,38 |
1,83 |
4,83 |
1,88 |
-1,352 |
0,225 |
Сравнение гранитов неизвестного возраста со среднепалео зойскими гранитами:
по NajO: F = 1,38 = 1,14;/| = 29;/ 2 = 99; F = 1,60 1,21
по К20: ( F = 7 ^ = l«32;/1= 29;/2 = 99;/^ -1,60j;
по ТЮг: \ F = |
= 1,19;/, = 99; / 2 = 29;F s 1,80 |
0,225
Сравнение гранитов неизвестного возраста с верхнепалеозой скими гранитами:
«ONa2O:fF = b § = l,10;/, = 99;/2 =29;/^ sl,8ol;
V |
у |
ио К20: ( F = ~ |
= U 1;/, = 29;/ 2 = 9 9 ;^ s 1,6о\ |
по ТЮ2: F = 0,321 = 1,43;/= 99;/2 =29;FKps 1,0 0,225
fio всех случаях рассчитанные значения критерия Фишера ока зались меньше критических, следовательно, рассматриваемые гра ниты по степени изменчивости содержаний данных химических элементов существенно не отличаются ни от среднепалеозойских, ни от верхнепалеозойских. Поэтому характеристики изменчивости в данном случае нельзя использовать в качестве классификационно го признака.
В процессе решения геологических задач иногда приходится сравнивать по степени изменчивости разные признаки, например мощность рудного тела и содержание в нем полезного компонента. В этом случае проверяется гипотеза о равенстве их коэффициентов вариации V\ и V2. Для этого используется величина
г2 (
F = у? |
H.+1J/ |
1 + VS |
|
i + v, |
КП2+К |
||
1 |
V"! |
|
которая также распределена по закону Фишера с я ( - 1 и 1 сте пенями свободы, при условии, что в знаменателе стоит меньшая из
Непараметрическим аналогом критерия Фишера является кри терий Сиджела-Тьюки, по процедуре вычисления во многом сход ный с критерием Вилкоксона. Он применим для распределений лю бого вида и не чувствителен к аномальным значениям, поэтому весьма удобен для решения геологических задач, особенно по вы боркам малого объема.
Критерий Сиджела-Тьюки построен исходя из предположения о равенстве центров распределения сравниваемых совокупностей. Поэтому в случае несоблюдения этого условия исходные данные по каждой выборке необходимо центрировать относительно их меди ан, то есть сравнивать не сами значения изучаемых параметров, а их отклонения от медиан.
Значения сравниваемых выборочных совокупностей объеди няются в общую выборку и записываются в виде вариационного ряда в порядке их возрастания: х\ <х2 <х3 < ... <хд,_ь где N = п\ + п2 - объем общей выборки; щ - объем меньшей выборки. Члены вариа ционного ряда, в свою очередь, ранжируются следующим образом; ранг 1 приписывается наименьшему члену ряда xi; ранг 2 - наи большему, то есть хы, ранг 3 - значению х2; ранг 4 - значению xN^ и т. д. Если N нечетно, то медианному значению ранг не присваива ется. При таком ранжировании значениям выборки с меньшей дис
персией будут присваиваться преимущественно |
большие |
ранги, |
а значениям выборки с большей дисперсией - |
наоборот, |
малые. |
В случае равенства дисперсий значения из разных выборок будут чередоваться в ранжированном ряду случайно, и сумма рангов, от носящихся к членам, меньшим по объему выборки, будет обладать всеми свойствами рассмотренного выше критерия Вилкоксона W. Дальнейшая проверка гипотезы о равенстве дисперсий сводится к нахождению критических значений W\ и W2 по описанной выше процедуре и сравнению с ними рассчитанного значения W.
Пример. По одному из участков молибден-вольфрамового ме сторождения для контроля бороздовых проб (выборка А) отобрано
16 валовых проб большой массы (выборка Б). Проверим гипотезу о авенстве средних значений и дисперсий содержаний молибдена по робам, отобранным разными способами при альтернативах
# 1 : х Ф хБ, Н[:а Л2 * и уровне значимости а = 0,1.
Результаты проверки гипотез позволяют сделать следующие выводы:
-различие в средних содержаниях молибдена по пробам раз ной массы несущественно, следовательно, опробование малыми пробами не приведет к систематическим ошибкам в оценке средней качества руд;
- содержания по бороздовым пробам отличаются большим раз бросом, следовательно, для оценки среднего содержания молибдена с заданной точностью их требуется значительно больше, чем валовых.
2.8. Анализ однородности выборочных геологических совокупностей
При использовании одномерных статистических моделей для описания свойств геологических объектов предполагается, что дан ный объект однороден в отношении изучаемого свойства. Обычно вопрос об однородности решается исходя из принятой геологиче ской модели. Исследуемый объект считается статистически одно родным, если он однороден по геологическому строению. Однако на ранних стадиях изучения трудно однозначно решить вопрос о еологической однородности на основе только качественной геоло гической информации. В этих случаях можно использовать обрат ный прием - получать суждение о геологической однородности объекта путем проверки гипотезы о его статистической однородно сти, используя количественные данные о характере изменчивости его свойств.
Задачи, основанные на проверке гипотезы о статистической од нородности геологических объектов, можно разделить на три типа:
-выделение аномальных значений;
-разделение неоднородных выборочных совокупностей;
-оценка степени влияния различных факторов на характер из менчивости свойств геологических объектов.
Выявление локальных неоднородностей (аномалий) в строении геологических объектов имеет исключительно важное практическое значение при проведении поисковых работ, так как они часто ис пользуются в качестве признаков, указывающих на наличие повы шенных концентраций полезных ископаемых.
Наличие же в выборочных совокупностях резко выдающихся значений, обусловленных локальными причинами и не характерных для данного геологического объекта, в целом снижает точность вы
числения точечных и интервальных |
оценок средних параметров |
и затрудняет решение рассмотренных |
выше задач на основе про |
верки гипотез о равенстве средних и дисперсий.
Для выделения аномальных значений совокупность результа тов наблюдений рассматривается как выборка из двух различных генеральных совокупностей - «фоновой» и «аномальной». При этом аномальные значения присутствуют в выборке в очень небольшом количестве или совсем отсутствуют.
В случаях нормального распределения фоновой генеральной совокупности эта задача решается с помощью параметрических критериев Смирнова и Фергюссона.
Н. В. Смирновым было установлено, что если максимальный по значению член выборочной совокупности не является аномаль
ным, то величина t = (xmax - x )/S ^ u имеет распределение, названное его именем. В данной формуле хтахмаксимальный член выборки;
х - среднее арифметическое; SC2Mсмещенная оценка дисперсии, которая рассчитывается через несмещенную оценку дисперсии S2
по формуле S(u = S ' / 1- 1'
\ « )
Если рассчитанное значение критерия больше допустимого, определенного по таблицам распределения Смирнова для заданной доверительной вероятности и п степеней свободы, то максимальное значение выборки следует считать аномальным.
Критерий Фергюссона основан на том, что если выборочная совокупность не содержит аномальных значений, то оценка коэф фициента асимметрии А будет распределена асимптотически нор мально с математическим ожиданием 0 и дисперсией .
Если рассчитанное значение коэффициента асимметрии пре вышает табличное для заданной доверительной вероятности и п степеней свободы, то максимальное значение выборки следует при знать аномальным. Если распределение фоновой совокупности от личается от нормального, то «аномальными» будут признаваться все редко встречающиеся большие значения, принадлежащие ис следуемой генеральной совокупности. Это ограничивает область применения обоих критериев. Они могут применяться только в том случае, если заранее известно, что распределение фоновой совокуп ности является нормальным.
В практике геохимических исследований за аномальные значе ния часто принимают маловероятные значения, по абсолютной ве личине превышающие За ± х или Зс ± 2 а , то есть отличающиеся от среднего на утроенное или удвоенное значение стандартного от клонения. Однако этот способ нельзя признать корректным, так как он не гарантирует отсутствия ошибок как первого, так и второго рода, причем вероятность этих ошибок оценить нельзя.
Таким образом, задача выявления аномальных значений невоз можно решить универсальными статистическими методами. Ано мальное значение должно определяться опытным путем на основе анализа геологических причин изменения значений изучаемых свойств. Статистические характеристики при этом будут иметь вспомогательное значение.
Если количество наблюдений, принадлежащих разным геоло гическим совокупностям в неоднородной выборке велико, то воз никает необходимость и возможность ее разделения на несколько однородных совокупностей.
Кзадачам такого типа относятся:
-расчленение разреза осадочных пород по микрофауне;
-расчленение немых толщ по петрографическому, минераль ному или химическому составу;
-расчленение древней коры выветривания по комплексу гео
химических признаков;
-выделение маркирующих горизонтов;
-определение рационального комплекса геофизических мето
дов для геологического картирования; - таксономическая классификация ископаемых организмов
по морфологическим признакам;
-классификация метаморфических и интрузивных горных по род по химическому составу;
-выделение однородных подсчетных блоков при подсчете за пасов месторождений.
Решение этих задач включает операции по проверке гипотезы
онеоднородности исходной выборочной совокупности, нахожде нию границ входящих в нее однородных совокупностей и оценке параметров каждой из этих совокупностей. При этом для разделе ния исследуемого множества наблюдений или объектов на однород ные совокупности используются как формальные математические методы, так и экспертный метод, когда геолог на основании опыта и представлений о структуре изучаемого сложного геологического объекта первоначально выделяет элементарные условно однородные совокупности, а окончательные границы однородных совокупностей определяются после объединения элементарных совокупностей, раз личия между которыми признаются статистически незначимыми.
Простейшие способы разделения неоднородных выборочных совокупностей основаны на анализе графиков эмпирических кри вых распределения. На неоднородность выборки может указывать наличие на графике нескольких максимумов (рис. 9). Неоднородные выборочные совокупности можно разделить с помощью специаль ных палеток.
* 1 р
0,8 |
|
/ V |
0,4 |
А / |
/ в |
0
Рис. 9. Классификация амфиболитов по содержанию роговой обманки (по Б. М. Роненсону и др.): а - экспериментальный график распределения со держаний роговой обманки; б - графики плотности вероятностей для сово купностей А у Б и В\ в - графики интегральной функции распределения для совокупностей А у Б и В
2.9.Однофакторный и двухфакторный дисперсионный анализ
вгеологии
Свойства геологических объектов, как и любой другой сложной природной системы, обычно зависят от ряда факторов, обусловли вающих их изменчивость. Выявление этих факторов и оценка сте пени их влияния на изменчивость (неоднородность) свойств изу чаемых объектов осуществляется с помощью дисперсионного ана лиза.
Этот статистический метод основан на следующем принципе: если на случайную величину действуют взаимонезависимые факто ры А, В, ..., Д то общую дисперсию этой случайной величины а 2 можно рассматривать как сумму дисперсий а 2 = а 2 + а 2в +
По количеству оцениваемых факторов дисперсионный анализ подразделяется на одно-, двух- и многофакторный.
Каждый фактор представляет собой переменную дискретную или непрерывную величину, которая разделяется на определенное количество постоянных интервалов (уровней). Если количество за меров изучаемой случайной величины на всех уровнях по всем фак торам одинаковое, дисперсионный анализ принято называть равно мерным, а если разное - неравномерным.
Суждение о влиянии определенного фактора или комбинации факторов на изменчивость изучаемой случайной величины основа но на группировке ее замеров по факторам и их уровням и проверке гипотезы о равенстве дисперсий, обусловленных данными факто рами, с остаточной (случайной) дисперсией, вызванной неучтенны ми факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор или взаимодействие факторов оказывают суще ственное влияние на изменение изучаемого свойства геологическо го объекта.
С помощью дисперсионного анализа решается широкий круг геологических задач:
-проверяются гипотезы о влиянии литологических, петрофи зических, геохимических, структурных и других факторов на лока лизацию оруденения;
-выявляются элементы зональности различных геологических
объектов;