Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

смотренного выше случая изучения содержаний магния в воде;

наблюдений значительно

больше, чем

необходимых

оценок,

•а наша цель — сохранить,

насколько

это возможно,

исходную

информацию. В этом случае метод прямоугольников представ­ ляется более подходящим для получения оценок, чем метод линейной интерполяции. Однако читателю рекомендуется полу­ чить оценки по данным табл. 4.3 и тем, и другим методами и затем сравнить полученные результаты для уяснения различия между этими методами.

В геологии процедуры с равномерным пространственным распределением чаще всего использовались при подготовке стратиграфических данных (исследований разрезов, записей в буровых журналах и др.) для проведения временного тренданализа. Этот метод, в сущности, является не чем иным как процедурой сглаживания, и для своего применения требует равномерного расположения данных в пространстве. Такие ме­ тоды анализа временных рядов, как автокорреляционный и гармонический, также требуют для своего применения равно­ мерного распределения данных. В настоящее время методы анализа временных рядов, по-видимому, более мощные, чем другие методы изучения последовательностей наблюдений, и, вероятно, в ближайшее время найдут широкое применение. Однако эти методы требуют больших массивов информации, что ограничивает возможности их применения к стратиграфическим последовательностям и анализу хорошо разведанных рудных месторождений. Некоторые результаты были получены при изу­ чении последовательностей минералов, наблюдаемых в шлифах. Но это будет подробно рассмотрено ниже.

ЦЕПИ МАРКОВА

Многие геологические исследования связаны с изучением последовательностей результатов наблюдений, которые пред­ ставлены взаимоисключающими друг друга состояниями. В ка­ честве примера можно привести точечный подсчет содержаний минералов по пересечению шлифа, когда наличие того или ино­ го минерала определяет состояние в данной точке. При изуче­ нии стратиграфических разрезов или скважины, секущей зоны рудного тела, наблюдаются последовательности литологических типов пород, которым можно дать аналогичную классификацию. Наблюдения по пересечению можно провести с равными интер­ валами или же расположить их произвольно, как это обычно делается при изучении стратиграфических разрезов. В первом примере мы можем ожидать появления одного и того же со­ стояния, т. е. несколько последовательных наблюдений могут попасть в одну и ту же категорию. Этого, очевидно, не произой­

172

дет, если наблюдения делаются

только

 

 

 

 

 

з точках изменения состояния.

 

 

 

 

 

 

 

 

Данные, входящие в эти последова­

 

 

 

 

тельности, в сущности, такие же, как те,

 

 

 

 

которые используются при

автокорреля­

 

 

 

 

ции и взаимной корреляции. Теперь, од­

 

 

 

 

нако, мы будем изучать не расположе­

 

 

 

 

ние

состояний

в

последовательности,

 

 

 

 

а природу перехода из одного состояния

 

 

 

 

в другое. Мы рассмотрим методы, кото­

 

 

 

 

рые совсем не используют информацию

 

 

 

 

о положении наблюдений внутри после­

 

 

 

 

довательности, но зато позволяют полу­

 

 

 

 

чить информацию

о тенденции

одного

 

 

 

 

состояния следовать за другим.

 

 

 

-

 

 

 

Данные табл. 4.4 представляют стра-

 

 

 

тиграфический разрез, изображенный

на

 

 

 

 

рис. 4.4, в котором осадочные

породьиог

 

 

 

определялись в

последовательных точ-

Г

 

 

 

ках, расположенных на расстоянии 0,3 м.

-

 

 

 

Каждая литологическая

разновидность 5 -

 

 

 

была отнесена к одному из четырех вза-

:

 

 

 

имно

исключающих друг

друга

состоя-

;

 

 

 

ний— песчанику,

 

известняку,

сланцу и об­

 

 

 

углю, которые условно были обозначены

 

 

 

 

соответственно А, В, С, и D. Можно по­

 

 

 

 

строить матрицу порядка 4X4, в кото­

 

 

 

 

рой указывается, сколько раз данное со­

 

 

 

 

стояние следует за другим. Матрица та­

 

 

 

 

кого типа называется матрицей переход­

 

 

 

 

ных частот. Примеры таких матриц при­

 

 

 

 

ведены ниже. Исследуемый

стратигра­

 

 

 

 

фический разрез содержит 63 наблюде­

 

 

 

 

ния, поэтому имеется (п—1)=62 пере­

 

 

 

 

хода. Матрицу следует читать от строки

 

 

 

 

к столбцу. Это, например, обозначает,

 

 

 

 

что переходу из состояния А в состояние

 

 

 

 

С соответствует

 

элемент

матрицы

а!3,

 

 

 

 

т. е. если мы хотим знать, сколько раз

Рис. 4.4. Стратиграфиче­

осуществлялся переход из строки с но­

ский разрез,

в

котором

мером А в столбец с номером С, мы уви­

литологические состояния

дим,

что переход

из состояния

А в

со­

взаимно

исключают друг

стояние С произошел 5 раз по всей по­

 

друга:

 

А — песчаник;

В — извест*

следовательности.

Аналогично,

имеется

ияк; С — сланец; Z> —* уголь

пять переходов из состояния С в состоя­

 

 

 

матри­

ние А в этой последовательности; это

число — элемент

цы,

стоящий на

пересечении

строки

С

и столбца

А. Матрица

 

 

 

 

 

Т а б л и ц а 4.4

 

 

Стратиграфическая последовательность, представленная на рис. 4.4,

 

закодирована

с помощью четырех взаимно исключающих состояний:

 

 

 

 

песчаник (.4), известняк (В), сланец (С), уголь (D)

(Верх)

 

 

 

С

С

в

с

А

А

С

с

в

с

А

А

С

с

в

с

А

А

А

А

в

с

С

А

А

А

в

А

С

А

А

С

с

А

D

А

А

С

с

А

С

С

А

D

с

А

С

(Низ)

А

D

в

А

D

 

С

С

в

С

D

 

СС с С

переходных частот является хорошим способом выражения еледования одного состояния за другим:

 

А

в

с

D

 

Суммы по строкам

 

 

 

А

~ 18

0

5

0

-

23

Из 1

0

5

2

0

 

7

5

2

18

2

 

28

D

_

0

0

3

2

5

Суммы по столбцам

23

7

28

5

 

63 Общая сумма

Заметим, что суммы строк и суммы столбцов одинаковы при условии, что разрез начинается и кончается в одном и том жесостоянии: в противном случае две строки и два столбца отли­ чаются на единицу. Заметим также, что в противоположность тем матрицам, которые вычисляли раньше, матрица переход­ ных частот, вообще говоря, если последовательность начинает­ ся и кончается в разных состояниях, несимметрична, т. е.

Ctij-f-Clji.

Тенденцию следования одного состояния за другим можно выразить в виде матрицы, превратив частоты в десятичные дро­ би или проценты. Если каждый элемент i-й строки разделить на сумму элементов i-й строки, то полученная дробь выразит относительную величину, характеризующую, сколько раз за i-м состоянием будет следовать какое-либо другое состояние. В ве­ роятностном смысле эти числа являются оценками условной вероятности Р(/|£), т. е. вероятности того, что состояние / по­ явится вслед за данным в настоящий момент состоянием i. (Мы ввели необычное, но эквивалентное обозначение (Р (£-*/), которое можно считать вероятностью того, что за состоянием i будет следовать состояние /.) Это обозначение будет использо­ вано позже.

174

 

 

 

в

 

Общая

 

А

в

с

D

сумма

Л

~ 0,78

0

0,22

0

1,00

в

0

0,71

0,29

0

1,00

с

0,18

0,07

0,64

0,11

1,00

D

_ 0

0

0,60

0,40 _

1,00

Отсюда, например, видно, что если в некоторой точке мы находимся в состоянии С, то вероятность того, что литологиче­ ская разновидность на 0,3 м выше также есть С, равна 0,64, Вероятность того, что эта литологическая разновидность будет состоянием Л, равна 18%; она равна 7% для состояния В и 11% — для состояния D. Так как эти четыре состояния взаимно исключают друг друга и исчерпывают все состояния, то лито­ логическая разновидность должна быть одной из четырех. По­ этому сумма, заданная по строкам, равна 100%.

Если мы разделим суммы по строкам переходной матрицы частот на сумму общего числа переходов, то мы получим отно­ сительную долю всех четырех литологических разновидностей, представленных в этом разрезе. Этот фактор вероятностей на­ зывается маргинальным, или фиксированным вектором вероят­ ностей.

А0,37-

В0,11

С 0,44 D 0,08.

Напомним, что в гл. 2 совместная вероятность осуществле­ ния двух событии А и В равнялась

Р(Л, В) = Р(В\А)Р(А)

ПЛИ

Р(В\А) = Р(А,В)/Р(А).

Таким образом, вероятность того что состояние В будет следовать за состоянием Л, равна вероятности того, что реали­ зуются оба состояния А и В, деленной на вероятность осуще­ ствления события А. Если вероятности осуществления событий Л и В независимы, то

Р(А,В) = Р{А)Р(В) и

Р(В\А) = [Р(Д)Р(В)]/Р(Л) = Р(В),

т.е. вегюятность того, что состояние В будет следовать за со­ стоянием Л, есть просто вероятность того, что состояние В осу­ ществятся в этом разрезе, и эта вероятность задается соответ­ ствующим элементом в фиксированном вероятностном векторе.

175

Если все вероятности реализации состояний в разрезе незави­ симы, то такое же соотношение верно и для всех возможных переходов, например,

Р(В\А) = Р(В\В) = Р(В\С) = P(B\D) = Р{В).

Это позволяет нам предсказать, что матрица вероятностей пе­ рехода должна выглядеть так, как если бы частоты литологи­ ческих состояний в одной точке стратиграфического интервала были бы совершенно независимыми от литологии в точке, рас­ положенной ниже в непосредственной близости. Матрица ожи­ даемых вероятностей перехода будет состоять из строк, которые идентичны заданному вектору вероятностей. Для нашего стра­ тиграфического примера она имеет вид

А

В

С

D

в

 

А

в

с

D

 

-

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8 -

 

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

 

 

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

 

_

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

_

Мы можем сравнить эту матрицу ожидаемых вероятностей перехода с наблюдаемой матрицей переходных вероятностен, которую мы действительно наблюдаем при проверке гипотез о том, что все литологические состояния независимы от непосред­ ственно предшествующих состояний. Это делается с помощью' критерия х 2, причем сначала отношения, характеризующие ве­ роятности появления литологических типов, превращаются в частоты, для чего проводится умножение каждой строки на со­ ответствующее общее число событий:

Ожидаемые вероятности перехода

Общее число

 

-

0 , 3 7

о , п

0 , 4 4

0 , 0 8

-

X

23

=

-

 

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

 

X 7

=

 

 

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

 

X 28

=

 

_

0 , 3 7

0 , 1 1

0 , 4 4

0 , 0 8

_

X 5

=

_

Ожидаемые частоты

8,5 2,5

10,1

1 , 8 -

2,6

0,8

3 ,1

0,6

1 0 ,4

3,1

12,3

2,2

1 , 9

0,6

2 , 2

0 , 4 . .

По виду критерий %2 напоминает критерий, описанный в гл. 2, Каждый элемент матрицы частот перехода составляет катего­ рию, в которую входит как наблюденное, так и ожидаемое чис­ ло переходов. Эти числа сравниваются по формуле

..2 _ v ( О - Е ) *

(4.2)

1

 

где О — наблюденное число переходов из одного состояния в другое, Е — число ожидаемых переходов из одного состояния

176

в другое, если последовательные состояния независимы. Крите­ рий имеет (т—I)2 степеней свободы, где т — число состояний (одна степень свободы теряется в каждой строке, так как сум­ ма вероятностей в каждой строке равна 1,00). Как и с другими типами критерия %2, каждая категория должна иметь ожидае­ мые частоты по меньшей мере для пяти переходов. В этом при­ мере это не так, но мы можем применить консервативный кри­ терий независимости, вычислив проверяемую статистику для четырех категорий, у которых ожидаемые частоты больше пяти. Остальные категории можно комбинировать до тех пор, пока их ожидаемые частоты превысят пять.

Категории включают переходы А-*-А, Л-»-С, С-*-А и С-*С, Комбинируемые категории могут быть образованы из всех эле­ ментов строки В, всех элементов строки D и комбинаций пере­ ходов А ^ В , A ^ D , С^~В и C-+D. Получаемая статистика у/ имеет вид

X2 = (18— 8,5)8

(5 — 10,4)2 ,

(5 — 10,1)* ,

(18— 12,3)8

 

8,5

 

10,4

 

10,1

12,3 ,

1

( 7 - 7,0)2

,

( 5 - 5 , 0)2

,

(5 - 9 .8 )8

= 20,99.

|

-----ДТ---

^

5,0

9,8

 

 

 

 

Критическое значение у2 для девяти степеней свободы и 5%-но­ го уровня значимости есть 16,92; проверяемое значение значи­ тельно превышает это число, поэтому мы можем заключить, что гипотеза о независимости последовательных состояний не­ верна, т. е. существует статистически значимая тенденция для некоторых состояний иметь предпочтение в следовании за не­ которым другим состоянием.

Последовательность, в которой состояние в одной точке в вероятностном смысле лишь частично зависит от предыдущего состояния, называется марковской цепью. Названная так в честь русского математика А. А. Маркова, она является про­ межуточным звеном между полностью определенными (детер­ минированными) и совершенно случайными последовательно­ стями, Наш стратиграфический разрез указывает на цепь Мар­ кова первого порядка, т. е. статистическая зависимость существует между двумя соседними точками. Существуют так­ же свойства марковости высших порядков. Например, последо­ вательность Маркова второго порядка указывает на значимую условную зависимость между точками, предшествующими дан­ ной на двух предшествующих шагах.

С помощью матрицы переходных вероятностей мы можем оценить, т. е. предсказать литологию на 0,6 м (на два наблю­ дения) выше некоторой данной точки. Предположим, что мы начали с известняка (состояние В). Указанные ниже вероят-

12— 201

177

•пости оценивают литологическое состояние, соответствующее -соседней выше расположенной точке.

 

Состояний

%

А

(песчаник)

О

В

(известняк)

71

С

(глина)

29

О(уголь) О

Предположим, что следующая точка действительно попада­ ет в глину; мы можем затем определить вероятность появления заданной литологической разновидности в следующей точке:

 

Состояние

%

А

(песчаник)

18

В

(известняк)

7

С

(глина)

64

D (уголь)

11

Таким образом, вероятность литологической последовательности известняк—глина—известняк оценивается как

Р ( В- *С) X Р(С X В) = 29% X 7% *2% .

Однако есть и другой путь достичь в два шага состояния -известняка. Возможна также последовательность известняк— известняк—известняк. Вероятность получить эту последователь­ ность такова

Р{В-+В) х Р{В-+В) = 71% X 71 % «50% .

Так как другие переходы известняк—песчаник и известняк— уголь имеют нулевые вероятности, то эти две последовательно­ сти являются единственно возможными последовательностями, которые приводят от известняка к нему же в два шага. Веро­ ятность того, что порода на два шага выше известняка будет тоже известняком, невзирая на промежуточное литологическое состояние, будет суммой вероятностей, т. е.

Р (В—- А —*-В) ~ 0% Р(В~+В—>Bj=; 50 °/0

Р(В- +С- *В)= 2% Я (В D —> В) ~ 0%

" 52Vo

То же рассуждение можно применить для определения вероят­ ности появления любой литологической разновидности спустя два шага, если исходить из любого литологического состояния. Однако нет нужды рассматривать всевозможные последова­ тельности индивидуально, так как используемый при этом про­

178

цесс умножения и суммирования в точности соответствует матричному умножению. Если матрица вероятностей перехода умножается на себя (т. е. возводится в квадрат), то результат будет матрицей вероятностей переходов второго порядка в по­ следовательности:

г 0,78

0

0,22

0

- 2

- 0,64

0,02

0,31

0,02 -

0

0,71

0,29

0

 

0,05

0,52

0,39

0,03

0,18

0,07

0,64

0,11

 

0,26

0,09

0.54

0,11

_0

0

0,60

0,40

_

-0,11

0,04

0,62

0,23 .

Заметим, что суммы элементов строк квадрата матрицы также составляют 100%.

Наличие значимой марковости второго порядка можно про­ верить точно так же, как мы проверяли независимость между последовательными состояниями с помощью критерия Если повторить выкладки, проведенные ранее, только используя мат­ рицу переходных вероятностей второго порядка, то мы убедим­ ся в том, что эта последовательность не имеет значимого свой­ ства быть марковской цепью второго порядка.

Мы можем оценить вероятность состояния на любом шаге будущего, просто возводя в степень матрицу вероятностей со­ ответствующее число раз. Если матрица возводится в степень достаточно большое число раз, то она достигает устойчивого состояния, в котором все строки становятся равными фиксиро­ ванному вероятностному вектору, или, другими словами, полу­ чается независимая матрица переходных вероятностей, которая

не изменяется при последующих возведениях

в степень.

В приведенном выше примере вы можете

убедиться в том,

что наивысшие переходные вероятности соответствуют перехо­ дам из одного какого-либо состояния в себя, например перехо­ дам песчаник—песчаник, известняк—известняк и глина—глина. Очевидно, что эти переходные вероятности связаны с мощно­ стью выбираемых стратиграфических единиц и зависят от рас­ стояния между выборочными точками. Например, частоты вдоль главной диагонали матрицы частот переходов будут удваивать­ ся, в то время как внедиагональные частоты остаются неизме­ ненными в случае, если наблюдения проводились через каждые 0,15 м. Это в значительной степени усиливает марковское свой­ ство, однако весьма специфическим образом. Выбирая подхо­ дящее расстояние между точками опробования, мы сталкива­ емся со следующей проблемой: если наблюдения расположены слишком близко, матрица переходов отражает главным обра­ зом мощность более массивных стратиграфических единиц; если же расстояния между точками опробования слишком ве­ лики, тонкие единицы могут быть полностью пропущены.

12

172-

Вложенные цепи Маркова

Трудностей выбора подходящего интервала опробования можно избежать, если наблюдения производятся только тогда, когда происходит смена состояний. Стратиграфический разрез, например, может быть представлен как последовательность подстилающих пород, каждая из которых литологически отлич­ на от непосредственно предшествующей. В табл. 4.5 представ­ лены записи последовательности горных пород, пересеченных скважиной, пробуренной в Долине Мидленд в Шотландии. Скважина была пробурена на 480 м в каменноугольных отло­ жениях пенсильванского возраста, состоящих из переслаиваю­ щихся толщ глины, ила, песчаника и угольных пластов или корневых зон. Эти осадки интерпретировались как отложенные в дельте плоской равнины, подверженной частым затоплениям, так что можно ожидать, что некоторые литологические разно­ видности могут находиться в предпочтительных отношениях друг с другом. Данные взяты из большого числа скважин, изу­ чавшихся Даутоном.

Матрица переходных частот для четырех состояний, полу­ ченная для разреза Шотландской скважины, приводится ниже. Совершенно очевидна разница между этой и рассмотренной ра-

Т а б л и ц а 4.5

Последовательные литологические состояния, полученные в скважине, ■пробуренной в угольных пластах Долины Мидленд в Шотландии; взаимно исключающие состояния: А пустой сланец, В —сланец с ископаемыми остатками пресноводных раковин; С алевролит, D — песчаник

и Е — уголь или коренная зона; читайте вниз по столбцам [(5|

(Верх)

 

 

 

С D А Е Е А А А D

В D С В Е В В А С Е А

р

С D Е А .4

Е С Е

С

В D

А

С А

А С Е

D С

А

А С А С С А D А

А

Е

С

Е

А D

D Е А

Е D

Е Е А D D .4

С С D В А D С В А С D Е С С

А

D В С С С

А

D А С В С D С В D А С D А

D

С А

А

D

А С А D Е А А С D Е А В D С D

А А Е

Е

С

В

В

В С С В С D А А Е D А А А

г

D D С D А Е Е А А Е А Е Е С А В В Е В

ъ

С С D С В С А Е D А С С А D С А Е А А

с А А С А Е А С А В В Е D С Е D Е А Е В

D Е Е А В А D D С Е А А С D А С А В А Е

С

С С В Е С С С D А В С Е С D А С Е С А

А

D А А А D А А А D Е D А Е С D А А D D

В

С D Е В С С В Е С С С С А А А Е Е А В

р

В Е А А D D А А D А D А С В Е С А Е А

А Е А D В

С

С

В

Е Е С С Е В Е А D С С Е

D А

D Е А D Е Е А

А D А А Е А D С D D А

г D

А

А В

С

А

А

С

D А

В

С

А

D

А

D Е

В

(Низ)

D С С D Е А С D D А Е Е А С С D С А Е

С D А

С А

С D А С С А

А

Е

А

D

С

D D

А

 

-180

нее матрицей, состоящая в том, что все ее диагональные члены должны быть нулями, так как состояние не может следовать за самим собой. Матрица переходных вероятностей, получаю­ щаяся делением каждого элемента матрицы переходных частот на соответствующую сумму элементов строки, обладает тем же самым свойством. Последовательности, в которых переходы из некоторого состояния в себя запрещены, называются вложен­ ными марковскими цепями. Их анализ представляет специфи­ ческую задачу, трудность которой не всегда понятна геологам, •изучающим записи стратиграфических данных.

 

А

;Из

В

С

 

D

 

Е

Суммы по столбцам

 

 

 

в

 

 

 

 

А

в

С

D

Е

 

 

0

11

36

21

52

-

 

28

0

4

4

0

 

 

34

2

0

45

13

 

29

1

45

0

3

f

00 МС

23

9

8

0 .

 

119

37

94

78

68

 

Суммы по строкам

120

36

94

78

68

396Общая

сумма

Литологические состояния

закодированы

б у к в а м и :

А

яы, не содержащие ископаемые организмы

и мелкую

породу,

В — глины, содержащие раковины

пресноводной

фауны, С

алеврит, D — песчаник

и Е — уголь и коренные

породы. Соот­

ветствующая матрица

переходных

вероятностей

имеет

вид

 

 

 

В

 

 

Суммы по

 

 

А

В

с

D

Е

строкам

 

А

- 0

0,09

0,30

0,18

0,43

-

1,00

 

В

0,78

0

0,11

0,11

0,00

 

1,00

 

С

0,36

0,02

0

0,48

0,14

 

1,00

 

D

0,37

0,01

0,58

0

0,04

 

1,00

 

Е

_ 0,41

0,34

0,13

0,12

0

 

1,00

 

Маргинальный вероятностный вектор имеет вид

А0,30

в0,09

С0,24

D 0,20

Е0,17

Критерий

х 2, идентичный (4.2), может быть использован

для проверки

марковского свойства вложенной последователь­

181

Соседние файлы в папке книги