Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы моделирования в геологии

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
8.18 Mб
Скачать

-определяется влияние способа отбора проб на их достовер­ ность и представительность;

-оценивается влияние ландшафтных условий на интенсив­ ность проявления различных поисковых признаков;

-решается вопрос о влиянии гипергенных процессов на каче­

ство руд; - выявляются факторы, определяющие прочностные свойства

грунтов и пород и т. д.

При равномерном однофакторном дисперсионном анализе слу­ чайной величины х относительно фактора А, имеющего к уровней при количестве замеров на каждом уровне, равном л, результаты наблюдений обозначаются как x,j, где i - номер наблюдения (i = 1, 2 ,

..., л), a j - номер уровня фактора (/' = 1, 2 , ..., к),

и записываются

в виде табл. 4.

 

 

Таблица 4

 

 

 

Однофакторный дисперсионный анализ

Номер изменения

 

Уровень фактора

 

Ах

А г

A k

1

*11

*12

*1*

2

*21

*22

*2*

п

*л1

*п2

Хпк

Групповые средние

*\

 

**

По этим данным рассчитываются следующие статистики:

1) общая сумма квадратов отклонений наблюдаемых значений признака от общей средней:

с обШ= £ Х ( * о = *)1’

j =I <=i

2 ) факторная сумма квадратов отклонений групповых средних от общей средней, характеризующая рассеяние между группами:

к

СфЛКГ= п ^ ( х ( - х ) 2;

У = 1

3 )

остаточная сумма квадратов отклонений наблюдаемых зн

чений от своей групповой средней, характеризующая рассеяние

внутри групп:

 

 

 

 

И

П

п

~ Хк)>

 

Сост = £ (* ,,-* > )

■*"

С*/2 *2 ) •••

 

/=1

/=1

/=1

 

4)

общая, факторная и остаточная дисперсии:

 

 

 

V2

=- •"общ

 

 

 

о6щ

к ( п - \ ) ’

 

 

 

пт2

с

 

 

 

_ __факт_.

 

 

 

факт~ ( * - 1) ’

 

 

 

о 2 _

^ о ст

 

 

 

ост

* (и - 1) ’

 

5)

значение критерия Фишера:

 

F =

Значение критерия Фишера сравнивается с критическим значе­ нием для заданного уровня значимости а и числа степеней свободы

(к - 1) и к ( п - 1).

При неравномерном однофакторном дисперсионном анализе, когда количество наблюдений на уровне А\ равно п\, на уровне Л2 -

 

 

к

п2, ..., на уровне Ак - и*, а общее их число N= У я , факторная и

 

 

/=1

остаточная дисперсии находятся по формулам

 

_ 82,35

1,92;

 

х =-------

 

43

 

V2 - 6,70 + 3,61 + 4,26

14,57

°о6щ -

42

= 0,347 ;

 

42

с 2 15(1,51 - 1,92)2 +14(1,99 -1,92)2 +14(2,27 -1,92)2

факт -

«

 

2,52 + 0,07 + 1,72 4,31 = 2,155

4040

£k = i L 5 i = 8 ,45.

S l 0.255

При (,= £ -1 = 2, ( 2= N —k = 40 и а = 0,05 FKp = 3,24, а при а = 0,01 Ftp = 5,18.

Остальные операции выполняются так же, как при равномер­ ном анализе.

Пример. При изучении гидротермального свинцово-цинкового месторождения в гранитах высказано предположение, что на ин­ тенсивность процесса рудоотложения влияла степень предрудного метасоматического изменения пород. Для проверки этой гипотезы результаты опробования на свинец по 43 разведочным пересечени­ ям были разделены на три группы: в слабо измененных (уровень Ai), в средне измененных (уровень Аг) и сильно измененных (уровень AjJ гранитах.

Таким образом, с достаточно высокой доверительной вероят­ ностью гипотеза об отсутствии влияния степени метасоматиче­ ского изменения гранитов на содержание свинца в руде отвергает­ ся, и предрудный метасоматоз должен рассматриваться как один из ведущих рудоконтролирующих факторов.

Вычислительные операции при однофакторном дисперсионном анализе можно упростить, используя равенство Сост = СобщСфакт.

При двухфакторном дисперсионном анализе сумма квадратов отклонений от общего среднего разделяется на компоненты, отве­ чающие двум предполагаемым факторам изменчивости - А и В. Ес­ ли по фактору А выделяется р уровней, а по фактору В - q уровней, то общее количество групп будет равно т =pq, а исходные данные можно записать в виде табл. 5.

 

 

 

 

 

Таблица 5

 

Двухфакторный дисперсионный анализ

 

 

Уровень фактора В

Среднее

Номер изменения

В2

... В/

... в ч

 

Вх

 

А,

*11

*12

ХУ

*2V

 

А г

*21

*22

ХУ

*2q

*2

А,

*/1 */2

x p j

* /< 7

Ар

*р1

*р2

x p j

x p q

* P

Среднее

*1

*2

* j

 

X

 

 

 

 

 

Если для каждого сочетания факторов A,Bj произведено по и наблюдений (двухфакторный дисперсионный анализ с повторени­ ем), то в каждую клетку табл. 23 помещается п значений, а единич­ ное наблюдение обозначается как xjjk, где к - 1, 2, ..., п. Оценки средних значений по группам (ху), по факторам (х ,... и Ху) и об­ щее среднее ( х ) в этом случае рассчитываются по формулам

х

 

 

1

Ч П

1 Ч

f<-=—

у=1 к=1

Ч j=\

Чп

1 Р п

1 Р

* . j . =--ZZxv*— Ь г

Рп м м

Р м

Проверка гипотезы о влиянии на изменчивость изучаемого свойства каждого фактора в отдельности и их совместного влияния производится по критерию Фишера:

Ч2 S2

s;

Полученные значения F-критерия сравниваются с критическим для заданного уровня значимости и числа степеней свободы.

При расчете F-критерия в данном случае в знаменателе всегда берется остаточная дисперсия. Поэтому его значение иногда может получаться меньше 1.

Приведенные схемы дисперсионного анализа основаны на свойствах нормального закона распределения и предположении о равенстве дисперсий на разных уровнях одного и того же фактора. Однако F-критерий по выборкам достаточно большого объема ус­ тойчив и для совокупностей, умеренно отклоняющихся от нормаль­ ных. Умеренное различие в дисперсиях также не является препятст­ вием для его применения при условии приблизительного равенства объемов выборок по группам. Если возможность применения F-критерия все же вызывает сомнения, можно воспользоваться непараметричскими критериями.

Однофакторный непараметрический дисперсионный анализ

с применением критерия Краскала-Уоллиса включает следующие операции:

- ранжирование всех наблюдений по возрастанию от 1 до N,

к

где У = - объем всей выборки;

7=1

-нахождение сумм рангов Ru R2, .... F* для каждого уровня анализируемого фактора;

-вычисление критерия Краскала-Уоллиса по формуле

12

D2

(— +... + — ) - 3(N +1);

Н =-

N(N + 1)

п,

- сравнение полученного значения Н с его критическим значе­ нием (Нк) для принятого уровня значимости а.

При достаточно большом объеме выборки, когда количество наблюдений по каждому уровню превышает 5, значение Нк опреде­

ляется по таблицам распределения %2 для числа степеней свободы

/ = k —l , где к - количество уровней исследуемого фактора.

Если рассчитанное значение критерия Н превышает НК, то ги­ потеза об отсутствии влияния анализируемого фактора на изменчи­ вость изучаемого свойства отвергается.

При двухфакторном непараметрическом анализе Фридмана

исходные данные записываются в виде табл. 6 .

Таблица 6

Схема вычисления дисперсий при двухкратном дисперсионном анализе

Вид дисперсии

Сумма квадратов отклонений

Факторная

С, = n q j t ( x L - х ) 2

 

по фактору А

 

 

 

1=1

 

 

Факторная

С2 = пр i j ( X j - x j

 

по фактору В

 

 

 

 

 

 

Смешанная

Съ = п Z

Z

 

x L - X j

 

по факторам

-

+ x f

АВ

 

 

 

 

 

Остаточная

c = 4 ,

1,

 

 

 

 

 

 

 

Общая

P

4

n

/

\ 2

c = £

5

 

 

 

 

 

 

 

Число

степеней

свободы

P- 1

<7-1

(р- D (</-D

p q ( n - l)

npq—l

Дисперсия

s i - c '

1P-1

=Cz

2<7-1

3 (p -l)(9 -l)

p2

C4

4

P<7(« -1)

2

C

s 2

= --------

 

iipq -1

Для проверки влияния фактора А значения в строках таблицы ранжируются, то есть заменяются цифрами от 1 до q. По каждому

столбцу вычисляется сумма рангов Rj ( j =

р),

рассчитывается

статистика S = (Я,2+ . . . + + . . . + /? ,) 2 /<7

и

критериальная

статистика %2R= 1 2 S / pq(q + 1).

 

 

Для количества уровней по факторам А или В больше 4, крити­

ческое значение статистики определяется по таблицам критерия

X2 . Для количества степеней свободы { = q -1, а при малом количе­ стве уровней используются специальные таблицы .

Для проверки гипотезы о влиянии фактора В строки и столбцы в табл. 6 меняются местами.

Использованный в данной главе математический аппарат опи­ сан в специальных пособиях по теории вероятностей и математиче­ ской статистике. Приемы первичного анализа результатов массовых наблюдений подробно рассмотрены в монографии Дж. Тьюки. Много полезных рекомендаций по вычислительным методам стати­ стики можно почерпнуть из справочника Дж. Полларда.

Применению статистических методов при геохимических ис­ следованиях посвящены работы В. Н. Бондаренко, Д. А. Родионова. Многочисленные примеры использования одномерных статистиче­ ских моделей в различных областях геологии приведены в моно­ графиях Р. Миллера и Дж. Кана, У. Крамбейна и Ф. Грейбилла, Дж. Дэвиса.

Статистическому анализу угловых величин посвящена моно­ графия К. Мардиа.

Контрольные вопросы

1.Почему при изучении свойств геологических объектов мож­ но применять методы математической статистики?

2.Какие требования предъявляются к выборочной геологиче­ ской совокупности при статистическом моделировании?

3.Какие свойства геологических объектов можно описать не­ прерывными случайными величинами, а какие - дискретными?

4.Какие геологические задачи можно решать с помощью гис­

тограмм и кумулят?

5.Какие статистические законы распределения используются

вгеологии?

6. Как проверяются гипотезы о типе статистического распреде­

ления?

7. Для чего рассчитываются точечные и интервальные оценки свойств геологических объектов?

8 . Как строятся доверительные интервалы оценок средних зна­ чений в условиях нормального, логнормального, биномиального закона и распределений Пуассона и Мизеса?

9. Какие типы геологических гипотез можно проверять стати­ стическими методами?

10.Чем отличаются параметрические критерии согласия от не­ параметрических?

11.Чем различаются ошибки первого и второго рода при стати­ стической проверке гипотез?

12.Какие геологические задачи решаются путем проверки ги­ потез о равенстве средних?

13.Для чего используются критерии Стьюдента, Ван-дер- Вардена, Родионова, Вилкоксона, Ватеона-Вильямса, Вилера- Ватсона-Ходжеса?

14.Какие геологические задачи решаются путем проверки ги­ потез о равенстве дисперсий?

15.Для чего используются критерии Фишера, Сиджела-

Тьюки?

16.Какие геологические задачи решаются с помощью критери­ ев Смирнова и Фергюссона?

17.Какие геологические задачи решаются с помощью однофак­ торного и двухфакторного дисперсионного анализа?

3. МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ

Любое геологическое явление может быть охарактеризовано множеством признаков, поддающихся наблюдению и измерению. Геологические объекты должны рассматриваться как системы, за­ висящие от большого числа факторов и требующие для своего опи­ сания многомерного признакового пространства. Так, например, магматические породы сходного минерального и химического со­ ставов могут обладать некоторыми петрохимическими особенно­ стями, определяющими их специфическую рудоносность. Эти особенности не поддаются выявлению с первого взгляда, однако они могут быть установлены путем целенаправленной статистической обработки результатов химических анализов пород. При решении подобных задач необходимо совместное рассмотрение комплекса изучаемых признаков, то есть создание многомерной статистической модели.

3.1. Сущность и условия применения

многомерных статистических моделей

В качестве математической модели значений комплекса при­ знаков рассматривается многомерная случайная величина, которая часто называется случайным вектором. Многомерные модели под­ разумевают вероятность нормального статистического распределе­ ния рассматриваемых случайных величин или хотя бы возможности их нормализации. Однако статистические критерии для большинст­ ва процедур многомерного анализа разработаны при очень сильных ограничениях или основываются на логических соображениях. Не­ которые многомерные модели и методы (например, метод главных компонент и многие методы распознавания образов) вообще не имеют статистического обоснования, а критерии значимости для них еще не созданы.

Вследствие сложных стохастических взаимосвязей между изу­ чаемыми признаками (переменными) часто не удается принять пра­ вильного решения относительно каждой из них. В таких случаях очень эффективно всестороннее исследование системы с выделением

наиболее важных факторов, объединяющих влияние нескольких переменных.

Многомерные методы статистических исследований сложны как с теоретических, так и с методологических позиций.

В большинстве многомерных геологических задач приходится иметь дело со сложными сочетаниями действующих факторов, ко­ торые не удается выделить в чистом виде и изучить изолированно. Тем не менее, многомерные методы являются весьма перспектив­ ными и многообещающими средствами геологических исследова­ ний, поскольку они позволяют геологу одновременно работать с большим числом переменных, чем он может осознать сам. Совме­ стное изучение комплексов взаимосвязанных переменных (призна­ ков) способствует выявлению дополнительной, часто весьма суще­ ственной информации об изменчивости свойств изучаемых объек­ тов и обеспечивает возможность прогнозирования их неизвестных свойств.

Для работы с многомерными математическими моделями не­ обходимо знание основ линейной алгебры, поскольку записи ис­ ходных данных и математические действия над ними производятся в матричной форме. Общие сведения о матрицах наблюдений и ре­ зультатах вычислений можно найти в работе Дж. Дэвиса.

3.2. Многомерный корреляционный анализ

Многомерный корреляционный анализ применяется для выяв­ ления зависимостей между значениями различных геологических характеристик и разделением множества признаков по характеру их внутренних связей.

Статистические свойства случайных величин с я-мерным нор­ мальным распределением задаются их ковариационными и корре­ ляционными матрицами, которые могут быть вычислены по исход­ ным матрицам. С этой целью исходная матрица [А] порядка т х я умножается на ее транспонированный аналог [А]Т, расположенный слева*, причем между матрицами [А]ти [А] вводится промежуточ-

ный множитель [е ]------

, где [Е] - единичная матрица порядка

V ШJ

Соседние файлы в папке книги