Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

СЕГМЕНТИРОВАННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ

Зонирование

Зонирование — это разделение последовательности в относи­ тельно однородные сегменты, каждый из которых отличен от прилегающих сегментов. Палеонтологи, например, прибегают к зонированию стратиграфической последовательности на ос­ нове соответствующей избыточности ископаемых микроэлемен­ тов. Данные опробования могут быть разделены в относитель­ но однородные интервалы и будут представлять зоны постоян­ ной литологии, соответствующей стратиграфическим единицам. Данные траверсов, полученные воздушной радиометрической разведкой, подразделяются на зоны, которые могут быть интер­ претированы как пояса однородных скальных структур или минерализаций.

Имеется два основных подхода к зонированию. Простейший из них называется «локальным поиском границ». Он оснозап на поиске внезапного изменения средних значений, пли, что эквивалентно, на поиске наиболее сильного изменения градиен­ та последовательности. Для определения границ между почвен­ ными зонами вдоль траверса Уэбстер [56] развил метод сколь­ зящего среднего. Ряд значений изучается последовательным движением короткого интервала вдоль последовательности. Скользящий интервал называется окном. Он распадается на две части: сегмент от точки i+h последовательности до точки i и другой сегмент от точки i до точки ih.

Мера, называемая обобщенным расстоянием, вычисляется для разностей между сегментами внутри двух половинок окна. Обобщенное расстояние есть отношение, образованное делени­ ем квадрата разности между средними значениями двух сег­ ментов на объединенную дисперсию последовательностей в сег­ ментах. Обозначим это среднее сегмента от х; до Xt+h через А7,

и его дисперсию через Si2; среднее сегмента от

Xi до Xt-и че­

рез А7г и дисперсию через s22. Тогда обобщенная

разность есть

па __ (Ау А~а)2

(4.53)

«ia+-'2a

 

Заметим, что объединенная дисперсия есть просто сумма дис­ персий двух сегментов, так как оба сегмента содержат одно и то же число наблюдений. Также заметим, что первые и послед­

ние Л точек последовательности не

могут

попасть в различ­

ные зон:»:.

 

 

Представление на графике h как функции D2 приводит к пре­

образованию исходного траверса в

новую

последовательность,

г. которой границы зон имеют вид острых пиков. На рис. 4.26,а предел азлено первоначальное шестикилометровое сечение вдоль

242

а

б

Р и с , 4 . ^ 6 .

С о1с’ 1::г л

i u

к а г о р о м у к а з а н ы и з м и . ч е н л :!

с с о п с т з п о ч в ы яд*.

•?. 0 - :u i

 

j i p o b

.,i

Л(П;:и1 в ь . р х ч е . -

ч д о т п

Т е П м с

В а л л п

( A n t v n m ) :

 

а — i w ' - e u z h o c

i и o n e s '1л

по

перпоЛ

коупсу^нтс; б з и г .ч С 'о и з

О 2 и о .е -о .

 

 

" ■

' '

• опрод -.т M :W V

|р •{!{•

> i : u : \ ! У Ы

ца грлфлве а

 

верхней части Тейм Вэлли в Англии [56]. Образцы почв бил;

собраны

2П-метровыц интервалом

и проанализирозяшл

ц

27 евойств. с)то огромное множество измерений было ; жило •. помощью метода iл л ж : компонент, который будет р.дсе.мог реп s гл. б. Здесь мы юдько пометим, что указанное лсресече-

пне

иредегевл :ег н вбелое аффективную

линейную комбипа-

очно

;:с:а>

зорс.мпншх. На рис. 4.26,6

представлена -.анио::-

мооь D! от p..ccT—-mi л вдоль пересечения, сычисленная с не мсноло р.'С!Целл>;;ошсгсоя скользящего скид, которое схваты­ вает 18 точек.

Уэбстер сысчпег, что

выполнение стой процедуры

завись:

>г изменчивое! а исходной

последовательности и длины-

околь-

лпцего окна. Длиннее окно должно усреднять вдоль у нагих зон н может пропустить короткие интервалы. Однако око будет чувствительно к ошибкам изменчивости, возникающим вело-ко­ зне шумовых помех в записи исходных данных. Короткое окно более чувствительно и будет отождествлять малые зоны, но ме ­

леет привести к иррегулярному неинтерпретируемому

графику

D". Уэбстер опубликовал программу на языке ФОРТРАН, кс

iop-гя реализует этот метод нахождения границ зон

[57]

кг

4 4 3

Одно из возражений против методов локального поиска границ состоит в том, что они могут привести к получению не­

обычного числа

границ, в

частности, в

наиболее изменчивой

части последовательности.

Глобальное

зонирование основано

на другой идее,

а именно на разбиении

последовательности в

заранее заданное число сегментов, которые внутренне настоль­ ко однородны, насколько это возможно, и отличны от прилегаю­ щих сегментов настолько, насколько это возможно.

Одна из первых и наиболее практичных процедур такого рода была рекомендована Джиллом [21], который использовал итерационную версию дисперсионного анализа. Сначала после­ довательность делится на два сегмента, очень короткую на­ чальную часть и остаток последовательности. Сумма квадратов внутри сегментов S S Wвычисляется по формуле

т

ni

__

I т

 

S S v = 2

2

<Л'« - x -if /

2 ni - m>

(4-54)

/ =1

'= 1

/

/=1

 

где Xi, i-я точка внутри /-го сегмента, А,-— среднее /-го сег­ мента, щ — число точек в /-м сегменте, т — число сегментов. Сумма квадратов между сегментами SSb является мерой из­ менчивости средних сегментов относительно А'.., общего сред­ него объединенной последовательности или

SS„

J j

(4-55)

 

/=i

 

 

Разбиение на два сегмента движется вдоль последователь­ ности, и в каждом положении вычисляются две величины SSw и SSb. Для каждого возможного положения границы вычисля­ ется отношение

SSb ~ S S w

(4.56)

7~ S.Sb

Положение, соответствующее максимальному значению R, вы­ бирается в качестве первой зональной границы.

Далее, повторением процесса вставки дополнительной гра­ ницы, которая снова должна давать максимум R, эти две зоны снова подразделяются. Зонирование повторяется до тех пор. пока вен последовательность не разделится в заранее заданное число зон или пока величина R не перестанет увеличиваться при добавлении новых границ.

Процедура Джилла была использована для осуществления автоматического цифрового зонирования данных скважин. Не­ давно очень похожая процедура была опубликована Хоукингом и Мерриэмом [27], [28]. Они использовали глобальную оптнми-

24 4

зацию, основанную на методах динамического программиро­ вания. Как и алгоритм Джилла, этот алгоритм является итера­ тивным, но в силу его рекурсивности он имеет преимущество перед принципом оптимальности Веллмана в том, что в конце процедуры выбора границ зон дает самое лучшее разбиение из всех возможных. При использовании не рекурсивных процедур всегда возможно такое явление: позиция, выбранная как наи­ лучшая граница между двумя зонами, не будет наилучшей, если в одну из зон будет вставлена дополнительная граница.

Хоукинг и Мерриэм вычисляют величину, которая есть сум­ ма внутризонных дисперсий, эквивалентная величине SS\V в алюритме Джилла. Если эта величина вычисляется для всех возможных разбиений последовательности в два сегмента, тп результат будет некоторым табличным SS& для п—1 возмож­ ных положений первой границы. Для каждого возможного пер­ вого разбиения затем вычисляется новое значение S S Wдля всех возможных позиций второй границы, которая делит последова­ тельность на три зоны. Выбирая наименьшее значение ЗЗ^для второго разбиения, получаем оптимальное соответствующее по­ ложение первой границы и оно остается наилучшим, сколько бы дополнительных границ мы ни вставляли.

Процесс итерируется по третьему циклу, и для каждой ком­ бинации оптимальной первой границы со всевозможными вто­ рыми границами находятся всевозможные третьи границы и вы­ числяются соответствующие им значения 5S^. Выбор наимень­ шего значения S S W затем определяет оптимальное положение второй границы. Процесс повторяется снова и снова до тех пор, пока не будет найдено заданное число границ.

В силу рекурсивной природы алгоритма окончательное мно­ жество зон обладает наименьшей возможной дисперсией среди любого возможного множества с тем же числом зон, покры­ вающих весь интервал. К сожалению, этот метод непрактичен при очень длинных последовательностях из-за высокой цены вычислительных работ, выполняемых для достижения оп­ тимума.

Классификация по сходству

В этом разделе мы остановимся на методах упорядочения наблюдений на основе их относительного сходства по некото­ рому признаку. Если наблюдения характеризуются некоторым множеством переменных, то это в сущности требует их проек­ тирования некоторым образом на единственную прямую, на ко­ торой их положение логически соответствует их расположению л исходном множестве данных. Это может быть осуществлено одним из многих методов, таких, например, как метод главных компонент или факторный анализ, которые рассматриваются в

245

последней главе. Такой классификацией может быть хронологи­ ческое упорядочение, широко используемое в археологии, К со­ жалению, нет гарантий того, что последовательность наблю­ дений, упорядоченная по сходству, будет хронологически упо­ рядочена некоторым осмысленным образом. Понятия упорядо­ чения по сходству и простого упорядочения ранее широко не использовались в геологии, исключая применения численной таксономии в палеонтологии [51]. Однако имеется область,

вкоторой понятие упорядочения по сходству оказывается по­ лезным, а именно, исследование геологической корреляции двух стратиграфических последовательностей.

Два петрографических ряда данных можно исследовать совместно на основе сходства их записей в буровых скважинах. При этом их перетасовывают, подобно колоде карт, с помошью процедур динамического программирования [23]. Каждая точ­ ка одной последовательности сравнивается с наиболее близкой точкой другой последовательности, причем соблюдается лишь условие, что стратиграфический порядок должен быть сохранен

вобеих последовательностях. Таким путем достигается истин­ ное упорядочение по сходству, так как окончательное размеще­ ние имеет смысл как литологический, так и хронологический. Можно ввести дополнительные ограничения, которые приведут

кобъединению специфических точек двух последовательностей,

либо

обусловят объединение

какого-либо заданного сегмента

одней

последовательности с

некоторой точкой другой. Т.,к::м

образом, если основания маркеров ъ пределах двух сравнивае­

мых последовательностей отождествляются,

то эти основания

должны

соответствовать друг другу. Остальные члены корге-

'i n p o n . m u

на основе наибольшего сходства,

подчиняясь лися:

следующим ограничениям: линии корреляции ж* могут пересстдгьет и основания маркеров должны быть корпелшюваиы.

Алгоритм, оау бликованный Горденом и Рен ментом [23]. на- аимг.ш-эг алгоритм зонирования Хоукинга ч Меррнэма [28].

Сн:.ч.\’1

каждая точка последовательности,

ег:отлстстзс10ща"

первой

скважние, сравнивается с каждой точкой последов.,

■юоддгости,

со;/-зз:. 1зующсЯ второй

Имеется ;?

наб­

людений пт пемзой скважины и т — из второй, резульпы

сраз­

ивши!— таблица размера пХт. При -пом можно йснользоваiь множество различных сравнительных мер, но Гордон и Геймент используют простую меру несходства:

р

 

— ЩИ.

'4.57)

/=!

 

где /у,--отклик каротажной переменной I на глубине / ь пер­ вой скважине, а оц, — отклик той же переменной на глубине «

246

Р а з р е з

Разрез

 

 

 

 

 

 

V

 

 

Я

«5

Ъ

6__

 

( С тарт)_ 2j_ 2 _ 4 _6 |

 

и,

2 I

2

4

бТ б

 

и г

1|

1 2

4

!

4

 

и3

3

 

|31 3

| 3

 

и4

4

 

141

2

I

?.

 

 

4 I

4

1

2

\ 2 (Финиш)

0 1 2 3 4

 

 

О 1 2 3 4

5 G

 

 

 

 

Р и с .

- 27.

И с к у с с т в е н н ы е стратиграфические

разрезы, изображенные

вместе.

Разрез

у

сстсртш

три

интервала,

а разрез

V — четыре. Характеристика, измеренная на

чаждо;

 

{.птерпале.

изменяется от I до 6. Матрица

содержит простые меры рачл..жде-

 

 

1П‘я

я . жду г . е е м и возможными

П' - р а ч ь *

ы.-ерчллоз р. разрезах

Ь ' и !'

 

 

 

 

 

 

 

 

 

Hi

1

J

t/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и .

!

 

1

_

t .

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

I

V,

 

 

 

 

 

 

 

 

 

 

 

 

Т

 

 

 

 

 

 

 

 

 

 

IГ. \!

 

 

 

У

' : /]/'7~i77y

и ,

 

 

 

 

 

 

 

 

W

 

Ь2

 

 

 

 

 

 

 

 

-

 

 

U.y

:

 

 

 

 

 

 

 

 

 

 

 

и;.'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L'i

 

 

 

 

\ '/У'i

 

“ l

 

 

 

 

 

 

A

* ? .

4 - с

( С т а р т ) 2 ^ г 4

6 1 6

( С т а р - : J | 2 4

6 1 6

 

 

 

-

,

* '

J

 

 

 

 

9 1 I T

T

I T "

 

 

 

 

2 ' 2

6 , 6

2

2 - ?

6 | 6

 

 

 

 

 

 

 

1 *

1

 

 

 

 

 

4 г

 

 

 

 

0 | 0

2

4 1 4

0 | .0

2 - 4 | 4

1 ! 0

2

 

 

 

 

1 ! 1

1

•о

1

I I 1

1

3 i - 3

* 1 1

1

3 1 3

 

 

 

 

 

2

 

 

 

 

2 ! 2 0

 

 

2 0

2

2

I ! 2

0

2

! 2

 

 

 

 

- 4

0

2

1

2

---------------- .-4 _

______

 

 

 

2 I

2

2(*Рикиш)

2 |

2

0

2 ;

2 Д 5и н и ш ) Г -*) 2 - 0

- 2 - г 2 (Я>И1

 

 

 

 

 

Е

 

3 7

 

 

£

= 2 6

 

Е

=

16

 

 

Рис. 4.28. Результаты, полученные объединением последовательностей U и V.

Стрелки

в

матриц-:',х показывают

псгл',дсват?ль:тогть путай от

основания дс

гершипы.

 

 

 

 

 

 

 

Обшес расхождение

обозначено через 2

 

 

 

 

зо второй скважине. Если угодно, различным переменным

можно приписать веса сон

позволяет

най-

Алгоритм динамического программирования

. и единственный путь в этой таблице из левого

верхнего

угла

• , правый нижний угол таким образом, чтобы сумма мер не­ сходства была минимальной. Стратиграфический порядок со­ храняется благодаря тому, что исследователь может двигаться только in-:з ;• направо. Но рис. 1.27 изображен несложный при­ мер, в котором проводится сравнение трех интервалов карота­ жи одной скважины с четырьмя интервалами другой. Замелим. iTO большая часть строк п столбцов матрицы повторяется; это

247

позволяет алгоритму спустить вниз ту или иную каротажную диаграмму к началу и закончить процесс. Некоторые примеры путей в матрице вместе с соответствующими им результатами стратиграфической корреляции приведены на рис. 4.28.

Для нахождения оптимального пути используется рекурсив­ ная процедура. Начиная с левого верхнего угла (начало) вы­ бираем первый интервал равным щ или щ; мера несходства вдоль любого пути одинакова и равна 2+2. Если выбрать ии следующий интервал может быть либо и2 с общей мерой не­

сходства 2+ 2 + 0 = 4, или

v\ с общей

мерой

несходства 2+2 +

+ 2=6. Другой вариант

может быть

таким:

если V\ выбрали

на первом шаге, на втором шаге можно выбрать либо v2, либо «1. Пусть v2 Дает вклад в общую меру несходства, равную 2+ + 2+2=6. Выбирая из этих двух случаев тот, в котором путь (начало)->«1-^П2 имеет минимальную меру несходства, полу­ чаем, что собственно первый шаг осуществляется в щ.

Выбрав в качестве начальной точки щ с двумя возможными вариантами второго шага либо в и2, либо в щ, исследуем воз­ можные варианты третьего шага. Снова имеется четыре воз­ можности: из «2 в «з с общей мерой несходства 2+2 + 0+1 = 5; из и2 в щ (2+ 2 + 0 + 0 = 4 ); из щ в v2 (2+2 + 2+ 4=10); и из щ в и2 (2+2 + 2+ 0= 6). Наименьшая сумма соответствует пути (начало)->«1->-«2-»-1'1. так что оптимальный второй шаг — пере­ ход в точку и2. Далее проводится следующая итерация, в кото­ рой исследуется результат осуществления четырех возможных переходов из и2. Путь с минимальным значением меры несход­ ства определяет оптимальный шаг после и2. Процесс повторя­

ется до тех пор, пока нижняя (левая) точка

(коней) будет до­

стигнута. В приведенном примере оптимальный путь есть

(начало) -»- и, -> и2 + -> «з -*■ v2

«4

(конец)

с общей мерой несходства 10. Матрица

и полученные

страти­

графические последовательности изображены

на рис.

4,29.

 

: . 4 , 2 0 , Оптимальнее объединение ыс.-.тед-#'» тельное red V п

V.

С Iр,'л,

- -трягак

указывают

цорядок путей в

ернвнняаема

иогле •оч»1рл..и« тя»

Об-цое ;ь<.яеждеиие

равно 10,

". е. наименьшему

возможному

авачгьяю

для' тобот

 

 

 

последовательностн

 

 

248

249

В силу своей гибкости этот метод слежения кажется потен­ циально очень эффективным средством исследования корреля­ ции. К сожалению, даже при использовании мощного аппарата динамического программирования он требует большого машин­ ного времени, и совместное отслеживание длинных последова­ тельностей можно рекомендовать лишь при выполнении иссле­ дований исключительной важности.

АВТОКОРРЕЛЯЦИЯ

На рис. 4.30 представлены результаты гамма-каротажа ча­ сти скважины в разрезе Пенсильванских отложений в запад­ ном Канзасе. Разрез состоит из измененных известняков и сланцев. Из-за радиации калия-40 в глинистых минералах слан­

цы характеризуются

относительно вы­

£

200

соким фоном,

в то

время

как извест­

■ гео

някам

свойственна

низкая

радиоак­

 

 

тивность. В этом частном разрезе

 

 

было

замечено

наличие

циклотем, т.е.

 

 

более или менее регулярных повторе­

 

 

ний

литологических

разновидностей.

 

 

Беглого взгляда на результаты каро­

 

 

тажа достаточно, чтобы убедиться в

 

 

том, что известняк переслаивается со

 

 

сланцами, которые

имеют

приблизи­

 

 

тельно ту же мощность.

 

 

 

 

 

 

Повторения, так же как и другие

 

 

свойства последовательности, устанав­

 

 

ливаются . с помощью вычисления

 

 

меры сходства между членами этой

 

 

последовательности,

т.

е.

последова­

 

 

тельность сравнивается с самою собой

 

 

в последовательных положениях и вы­

 

 

числяется степень сходства между со­

 

 

ответствующими

интервалами.

Если

 

 

каждая

точка

сравнивается

последо­

 

 

вательно со всякой другой точкой, то

 

 

обнаруживаются

все позиции хороше­

 

 

го соответствия и также определяет­

 

 

ся степень несходства в других пози­

 

 

циях. Для осуществления этой опера­

 

 

ции временной ряд должен иметь не­

 

 

которые

характеристики.

Он

должен

 

 

состоять

из последовательности

наб­

Рис. 4.30. Результаты гам-

людений

переменной

Y,

измеренной в

ма-каротажа части последо­

последовательные

моменты

времени

вательности пенсильванских

отложений в нефтяной сква­

или в

точках

пространства.

Каждое

жине в Западном Канзасе

 

наблюдение должно быть отделено от предшествующего наб­ людения некоторым интервалом по времени или некоторым расстоянием, которые являются постоянными для данного ряда. Положение наблюдения в ряде мы будем обозначать нижним индексом, например Yt. Поэтому необязательно явно указывать время или расстояние для переменной X, так как оно вполне характеризуется индексом и может быть в случае необходимо­ сти определено благодаря тому, что Х = А t, где А — расстояние между соседними точками. Весь временной ряд содержит «то­ чек и имеет общую длину Т=А(п—1).

Расстояние между двумя любыми точками У/ и K/+t назы­ вается лагом длины т, где т — число интервалов между двумя точками. Это — смещение временного ряда относительно себя самого в предшествующий момент времени или в предшествую­ щем положении. Между временными рядами и цепями можно провести аналогию. Каждой связи в цепи соответствует наблю­ дение в ряде. Если мы приложим два одинаковых сегмента цепи друг к другу и сравним их между собой, то получ,чм попар­ ное сравнение с лагом 0. Если мы сдвинем одну цепь на одно звено так, чтобы первое звено первой последовательности срав­ нивалось со вторым звеном второй, то все другие звенья также сдвинутся, и такое положение сравниваемых последовательно­ стей называется имеющим лаг 1. Цепи могут быть сдвинуты более чем на одно звено, и попарное сравнение тогда будет иметь лаг 2 и так далее.

Автоковарнация с лагом т — это ковариация между всеми наблюдениями Yt и наблюдениями У<+т, т. е. ковариация вы­ числяется между членами самого ряда и того же ряда, смещен­ ного на лаг длины т. Определяющее уравнение автоковариации есть

 

 

П

 

C O V .

-

У/_.-i к,у,_ т- ь :,у ,_ т.

(4.58).

Автоковариация

с

лагом 0 —это просто дисперсия

времен­

ного ряда. Если ряд очень длинный, а лаг т короткий, то сред­ нее данного ряда и сдвинутого рядов в сущности тождествен­ ны и уравнение (4.58) может быть упрощено. Однако если т является значимой дробной частью длины временного ряда, то различие между средними становится существенным. Вычисли­

тельный эквивалент уравнения

(4.58) есть

 

п

п

п

COVt

/=!

S у' Е V ,

(4.59)

 

( л т ) ( Л т 1)

250

500

Рис. 4.31 Автокорреляционная функция гамма-каротажа, изображенного на рис. 4.30.

Лаг 48 соответствует сдвигу по глубине на 48 футов

Имеется соглашение о том, что автоковариация вычисляется для лагов от 0 до примерно п/4. Полученные значения можно представить как автоковариограмму или автоковаркационную функцию, которая представляет зависимость автоковариацни от лага. Рис. 4.31 представляет автоковариационную функцию для данных каротажа скважин, изображенных на рис. 4.30.

Кривая начинается с максимального значения 672 для

лага

г—~0, затем убывает и поднимается снова

до лага 48, который

соответствует расстоянию в пространстве,

приблизительно

рав-

гому 48 футам, так как данные гамма-каротажа были оцифро­ ваны с интервалом в 1 фут. Это есть приблизительно величина вертикального расстояния между последовательными положе­ ниями известняков в последовательности, представленной на рис. 4.30.

Единицы, в которых измеряется автоковарнация — это квад­ раты единиц измерений временного ряда; в нашем примере — это квадраты единиц электродвижущей силы Е. Это означает, что автоковариация чувствительна к изменениям масштаба вре­ менного ряда, что доставляет затруднения при сравнении двух автоковариограмм. Однако если временной ряд стандартизован вычитанием из каждого наблюдения среднего и делением на стан­ дартное отклонение, ряд будет представлен в единицах стан­ дартного отклонения и автоковариация будет иметь стандарти­ зованный вид. Как отмечалось в гл. 2, ковариация стандарти-

251

Соседние файлы в папке книги