Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 2

.pdf
Скачиваний:
0
Добавлен:
12.11.2023
Размер:
19.38 Mб
Скачать

Ясно, что необходимо иметь некоторый способ контроля по­ лученных результатов. Число данных точек должно как мини­ мум превосходить число коэффициентов в полиномиальном урав­ нении, в противном случае построенное уравнение регрессии нельзя использовать. Если в качестве статистических критериев использовать критерии скачков, то число контрольных точек определяет число степеней свободы и последнее должно быть довольно значительным для того, чтобы обоснованно применять /•'-критерий. Если число степеней свободы для отклонений неве­ лико (вследствие того, что число полиномиальных коэффициен­ тов близко к числу данных точек), то только крайне высокие значения коэффициентов корреляции могут быть приняты как значимые. Далее, мощность критерия (вероятность отсутствия ошибки второго рода) сильно убывает с уменьшением объема выборки. Конечно, число и расположение контрольных точек имеют прямое влияние на величину локальных отклонении, ко­ торые можно обнаружить при тренд-анализе структурных дан­ ных, и имеют связь с допуском в их определении.

Обыкновенно мы не рассматриваем контрольные точки, ле­ жащие за пределами границ нашей карты. Зачастую, когда об­ ласть карты немного выходит за пределы действительных границ данных точек, может быть несколько контрольных точек (конеч­ но, необязательно), расположенных в точности на границах карты. В таких случаях не существует почти никаких ограни­ чений на форму поверхности тренда вблизи от краев карты. Какой бы.наклон ни был в контролируемой области, он экстра­ полируется без ограничений вдоль границ карты. Это явление называется «краевым эффектом», Если к имеющимся данным подбирается поверхность тренда высокого порядка, то экстра­ полируемые значения вблизи краев карты могут достигать аст­ рономических размеров. Более слабые краевые эффекты возни­ кают даже тогда, когда все поле карты вплоть до ее границы равномерно покрыто контрольными точками. Поэтому желатель­ но иметь данные по площади за пределами карты. Последние образуют вокруг карты «буферную область», в которой скон­ центрированы краевые эффекты; контрольные точки в этой об­ ласти определяют форму поверхности тренда внутри поля кар­ ты. Ширйна буферной области зависит в первую очередь от до­ пустимой плотности контроля. Если карта содержит много конт­ рольных течек, то достаточно узкой граничной полосы. Если контрольная плотность низкая, то для поглощения краевых эф­ фектов нужен значительно более широкий пояс вокруг карты. Отметим, что краевые эффекты свойственны не только поверх­ ностям тренда, но также встречаются при построении карт в изолиниях, поверхностей скользящего среднего, а также других типов аппроксимирующих поверхностен.

Расположение данных точек в пределах карты также влияет

Рис. 5,86. Влияние распределения контрольных точек на поверхность тренда:

и

и сх о д н а я

п ов ер хн ост ь со

сл учайн ы м

р а сп о л о ж ен и ем

к он трол ьн ы х

точек;

б

в озм ущ ен н ы й т р ен д ,

полученны й п утем о п р о б о в а н и я

и сх о д н о й и зуч аем ой

п ов ер хн ости

в

узк ой п ол оск е;

в — п очти

правильны й

тр ен д, п олучен н ы й

п утем

д о бав л ен и я

н еск ол ьк и х

д оп ол н и тел ь н ы х

точек за

п р ед ел а м и у зк о й

п ол осы

 

 

 

 

 

н абл ю ден и й

 

 

 

 

а

 

 

 

6

 

в

 

 

Р ис,

5 .87 .

В л и ян и е груп п и ровк и

к он тр ол ьн ы х точек

на

п о в ер хн ост и

т р ен д а

з —

и сх о д н а я

п овер хн ость

тр ен д а

третьей

степ ен и;

б

п ов ер хн ость

т р ен д а

п ол уч ен н ая

по

контрольны м

точкам , р асп ол ож ен н ы м

груп п ам и ;

в — п овер х

м еть т р е н д а ,

п ол уч ен н ая

п о

контрольны м

точ к ам , р асп ол ож ен н ы м

по

частич

ным п ересеч ен и ям п р ов ер я ем ой п овер хн ости

да форму регрессии. Примеры на рис. 5.86 приведены для того,

побы показать влияние распределения данных на

полиноми­

альные поверхности тренда [25]. Множество

точек

было слу­

чайно размещено на поверхности, имеющей

форму

бассейна,

к для них была найдена поверхность тренда второго порядка. Регрессионное уравнение затем было использовано для вычис­ ления значений зависимой переменной в точках, размещенных в соответствии с различными выборочными планами. В идеале поверхности, построенные по этим точкам, должны быть иденщчнымн поверхностям, для которых эти данные были получе­

д *

163

ны. На рис. 5.86, а показана поверхность, построенная по слу­ чайно распределенным точкам; точность аппроксимации выше 95%, и тренд в сущности идентичен тренду оригинала. Однако на рис. 5.86,6 выборочные точки распределены вдоль узкой по­ лосы. Точность аппроксимации еще высокая (93%), но Сама по­ верхность регрессии сильно смещена в направлении, параллель­ ном выборке. Для того чтобы исправить это смещение, доста­ точно лишь нескольких контрольных точек вне этой полосы, как показано на рис. 5.86, в, где точность аппроксимации также93%. Эти примеры показывают, что вид полиномиального уравнения сильно зависит от формы площади, занимаемой картой. Если данные не распределены приблизительно равномерно, то по­ верхность тренда вытягивается в направлении расположения точек. Напомним, что эти примеры составлены для идеализиро­ ванных моделей, т. е. моделей, не содержащих локальных пли случайных компонент; смещения будут более заметными, если имеется хотя бы незначительный «шум».

Отметим, что в ряде работ содержатся предостережения, ка­ сающиеся плохого влияния групповых скоплении точек на по­ верхность тренда. Группирование контрольных точек причиняет особое беспокойство при разведке нефти, так как скважины наиболее густо расположены в пределах уже известных нефтя­ ных полей. Такие площади могут оказывать значительное влия­ ние на региональный тренд, хотя очевидно, что этот эффект не столь страшен, как это иногда кажется [25]. На рис. 5.87, а изо­ бражена модель поверхности тренда третьей степени, исполь­ зуемая для вычисления значений в данной точке с целью изуче­ ния эффекта группирования. Были взяты точки из различных групп и была сделана попытка воссоздать первоначальную по­ верхность. На рис. 5.87, б указана поверхность тренда, постро­ енная по данным точкам, довольно явно сгруппированным. По­

строенная поверхность

учитывает 99% исходной

изменчивости.

Еще более отчетливая

группировка указана на

рис. 5.87, в, но

кубическая поверхность учитывает 100% суммарной изменчиво­ сти. Рисунки 5.87. б и 5.87, в в сущности идентичны исходной по­ верхности. Эти эксперименты показывают, что методы тренданализа, по-видимому, более устойчивы относительно группиро­ вания, чем это обычно предполагается. Напомним еще раз, что указанные критерии по существу не содержат шума и что при наличии локальных изменений возможны более серьезные изме­ нения поверхности тренда.

Ч ЕТ Ы РЕХ М ЕРН Ы Й ТРЕНД-АНАЛИЗ

Логическое обобщение полиномиального тренд-анализа тре­ бует введения третьей географической координаты (а также ее степеней и смешанных произведений с другими пространствен-

164

иыми координатами) в качестве независимой переменной. По­ лучаемая регрессия имеет несколько названий: «гиперповерх­ ность», «изоплетная огибающая», «H-V-T^-тренд» или просто четырехмерная поверхность тренда. В этом методе зависимая переменная, обычно процентное содержание некоторой компо­ ненты, изменяется с востока на запад, с севера на юг и по вы­ сотной координате, и изолинии представляют собой линии уров­ ня поверхностен более высоких размерностей. Результаты ана­ лиза изображаются в виде тела (в трехмерном пространстве), содержащего вложенные в него поверхности уровня. Эти по­ верхности интерпретируются так же, как и изолинии на обычной карте; они заключают равные значения состава. Так же как площади между двумя последовательными изолиниями на то­ пографической карте заключают точки, имеющие почти одина­ ковую высоту, так и объем между двумя последовательными пзоповерхностями четырехмерного тренда заключает точки, имеющие почти одинаковые значения состава.

В качестве простого примера рассмотрим данные, приведен­ ные в табл. 5.23. В ней представлено процентное содержание оксида урана в небольшом карнотитовом теле в юрских отло­ жениях плато Колорадо. Такие небольшие, но богатые рудные гема сформировались в результате замещения скоплений орга­ нических остатков в осадочной толще урановыми и ванадиевы­ ми минералами. Рудное тело имеет форму эллипсоида; содер­ жание урана увеличивается по направлению к центру. Протя­ женность рудного тела, грубо говоря, определяется общей дли­ ной скоплений органических остатков, которые образуют ядро. Рудное тело было тщательно опробовано, а анализ собранных проб дал прекрасный пример данных, пригодных для построения по!ыре.хмерной поверхности тренда,

Легко убедиться, что как построение стереоскопической или перспективной карты, так и создание пространственной модели переменной, изменяющейся в трехмерном пространстве, явля­ ются нелегкой задачей. Трудность увеличивается, если значения временной в контрольных точках содержат случайную компо­ ненту. Традиционный метод построения состоит в создании карт для различных уровней или ряда сечений, оконтуривании их д совместном их изображении. К сожалению, метод изолиний оперирует с градиентами лишь одномерных или самое большее 1нумерных векторных полей. Почти весь процесс построения и сглаживания изображений субъективен, и модель, построенная по контурным уровням, может значительно отличаться от моде­ ли. построенной по оконтуренным сечениям, за исключением чинь самых простых примеров.

Четырехмерный тренд-анализ особенно полезен при построе- |"ш таких моделей. Точки опробования могут располагаться в чространстве нерегулярно, и их не нужно проектировать на

165

 

 

 

 

Т а б л и ц а

5.23

С о д е р ж а н и е о к си д а у р а н а Y (в % )

 

 

в к ар н от и тов ом

т ел е

 

 

 

Л?1

X}

 

Хз

 

T, %

4,0

3,0

 

5,0

 

1,2

 

5,0

3,0

 

8,0

 

12,4

 

5,0

5,0

 

8,0

 

0,6

 

6,0

2,0

 

9,0

 

1,1

 

8,0

3,0

 

10,5

 

11,0

 

9,0

2,0

 

8,0

 

6,7

 

10,0

3,0

 

5,5

 

12,4

 

10,0

5,0

 

8,5

 

1,4

 

13,0

1,0

 

6,0

 

3,2

 

14,0

3,0

 

8,5

 

17,4

 

15,0

3,0

 

6,0

 

9,8

 

16,0

4,5

 

9,0

 

3,3

 

17,0

2,0

 

7,5

 

1,8

 

19,0

3,0

 

4,5

 

4,7

 

20,0

3,0

 

7,0

 

21,4

 

20,0

3,0

 

10,0

 

7,6

 

22,0

5,0

 

8,0

 

2,9

 

24,0

5,0

 

11,0

 

0,8

 

25,0

3,0

 

6,5

 

23,2

 

26,0

2,5

 

9,0

 

12,6

 

27,0

1,5

 

6,5

 

1,5

 

28,0

1,5

 

7,0

 

3,1

 

29,0

1,5

 

11,0

 

4,0

 

29,0

3,0

 

9,0

 

17,2

 

30,0

4,0

 

13,0

 

6,0

 

31,0

4,5

 

7,0

 

4,8

 

34,0

1,0

 

10,5

 

0,3

 

35,0

4,0

 

8,0

 

4,9

 

36,0

3,0

 

10,5

 

17,7

 

37,0

3,0

 

13,0

 

8,1

 

38,0

1,5

 

10,0

 

1,6

 

40,0

2,0

 

14,5

 

4,1

 

40,0

4.0

 

15,5

 

2.3

 

42,0

4,0

 

13,0

 

8,7

 

К оор д и н аты

я вл я ю тся

р асстоя н и я м и

ф у т а х )

от

п р ои зв ол ь н о

в ы бр ан н ой

точки

в в ер хн ем

с е в е р о -за ­

п а дн ом у г л у

р у д н о г о т ел а (.Х ,— н а п р ав л ен и е с е ­

в е р — юг; Х г — гл уби н а;

Х 3 — н ап р ав л ен и е

в осток —

з а п а д ) .

 

 

 

 

 

 

плоскости. Градиенты векторных полей

могут рассматриваться

независимо от направления. По подобранной методом наимень­ ших квадратов поверхности тренда строится сглаженное изо­ бражение или простая форма, которая затем может быть распо­ ложена бесчисленным множеством способов. Вычислительные программы предусматривают получение «слоистых карт» (се­ чений, перпендикулярных любой из координатных плоскостей),

166

которые затем собираются в модель «яичной корзины». Ис­ пользуя графопостроитель, многие более сложные программы выдают перспективные, изометрические или стереоскопические проекции.

Так как мы добавили одну независимую переменную, то для построения поверхности тренда первой степени мы должны ре­ шить систему четырех совместных уравнений. Нормальные урав­ нения приведены ниже. Для упрощения обозначений снова опу­ щены пределы суммирования. Суммирование распространяется на все наблюдения по i от 1 до п.

2Y=bon + bi2X i+b 2 ZX0 + Ьг2Х«;

2*, У= &о2*, + b,2* ,5+ ЬЯЛХ, * 2 + Ъ32*s* ,;

(5.93)

2 * 2 Г= b02 * 2 + b12*Д 2 + Ь22*22 + Ъ32 * 2* 3;

2 * з Y — Ьо 2 * з + Ь \ 2 * 1 * 3 + Ь 22 * 2 * 3 ~г &з2 * з ,г.

Если сравнить эту систему уравнений с системой (5.82), то легко убедиться, что она является прямым обобщением (4.13). Эту систему в матричном виде можно переписать следующим образом:

 

Я

у

V

V

2

2 * з

r<V

2г

 

 

г Х х

А-

 

\

v

Л !

2* I

2 * ,

2 * i * 3

ь,

2

* i к

' (5.94)

‘u

2 * , Л '; VA1

V V V

 

2

* 2у

 

 

тшА■*' О*» Я

 

 

2 Л з 2 * 1* з 2 А%

2*-1

ь,-

2 * я У .

 

 

Построение

аналогичной

матрицы для получения уравнений

юверхности тренда более высоких порядков требует тех же oneраций, какие используются в тренд-анализе, лишь с добавлении

в смешанных произведениях

дополнительной координаты.

IJ

качестве упражнения получите

матричное уравнение для по-

нномиальной поверхности тренда второй степени с тремя неависимыми переменными. Сколько членов содержит матрица петемы? Этот вопрос затрагивает одно из наиболее серьезных граничений этого метода, так как матрицы систем уравнений

.ля поверхностей высокого порядка содержат очень много эле-

к-нтов. Следовательно,

решения становятся

неустойчивыми,

I выход состоит в стандартизации данных с учетом шкалы мат­

ичных коэффициентов,

после чего требуется

использование

ш-иболее эффективных и сложных процедур обращения матриц. Паже с этими предосторожностями часто невозможно получить надежное решение задачи построения поверхности тренда высо­ кого порядка по заданному множеству точек.

На рис. 5.88, а изображена полиномиальная поверхность тренда первой степени, построенная по результатам определе-

167

а

Рис. 5.88. Четырехмерные полиномиальные поверхности тренда для содержа­ ний урана.

Более темные внутренние тела — руда, содержащая свыше 10% оксида урана. В области, заключенной между внутренней и внешней огибающими поверхно­ стями, руда содержит 5— 10% оксида урана. В области, внешней к затемнен­ ному телу, руда содержит менее 5% оксида урана, о— поверхность первой степени; б — поверхность второй степени; в — поверхность третьей степени

ния содержаний урана. Тренд имеет форму параллельных плас­ тин, между которыми заключены объемы равных содержаний. Как и следовало ожидать, точность линейной модели невысо­ кая, т. е. только 2,3%. Поверхность второй степени изображена на рис. 5.88,6; точность этой модели значительно выше по срав-

168

нению с простой линейной моделью, и соответствующий ей вклад в суммарную изменчивость содержаний урана составляет примерно 59,9%. На рис. 5.88, в изображена поверхность регрес­ сии третьей степени, имеющая приблизительно ту же форму, что и поверхность второй степени, однако суммарная изменчи­ вость увеличилась до 79,3%.

Описанные выше эффекты, связанные с распределением ис­ ходного множества данных и имеющие значительное влияние на анализ поверхностей тренда, нельзя устранить и в четырех­ мерном случае, где они играют даже большую роль, так как неоедко возможны затруднения в получении проб с требуемых ин- |срвалов глубины. В идеале выборка должна быть равномерно распределенной внутри куба или, в худшем случае, внутри тол­ стой призмы, как это имело место в нашем примере. Хотя иног­

да и возможно реализовать равномерные схемы опробования,,

по чаще это очень трудно осуществить,

так как интересующий

пас район бывает в двух измерениях

намного

больше, чем в;

глубину. Такова ситуация, например,

в задачах

исследования

распределения стратиграфических составляющих в пределах за­ данных интервалов. Даже если исследуемая область распрост­ раняется на большую глубину, недоступность проб часто застав­ ляет нас ограничиваться рассмотрением тонкой плиты, что при­ водит к сокращению интервала на глубину. Это трехмерный аналог задачи, иллюстрация к которой приведена на рис. 5.88,6.

При изучении таких стратиграфических единиц, как форма­ ции, указанное затруднение преодолевается с помощью измене­ ния масштаба, вертикальные расстояния обычно измеряются в футах, в то время как горизонтальные — в милях. Это приво­ дит к растяжению в вертикальном направлении, и нарушения выборочной схемы несколько скрадываются на чрезмерно вытя­ нутой вертикальной шкале. Конечно, если окончательную рег­ рессию привести к истинной шкале измерений, то эти наруше­ ния вновь появляются. Существует лишь один компенсирую­ щий фактор, а именно: изменения в составе в пределах осадоч­ ной стратиграфической единицы более ярко выражены в на­ правлении, параллельном стратификации, причем изменения вблизи кровли и подошвы слоя уменьшают влияние смещения. Однако при изучении состава тел, которые распространяются па большие глубины, например граниты магматического проис­ хождения, смещения, вызванные ограниченным выборочным пространством, могут быть очень сильными. В этих случаях большие градиенты на поверхности вблизи нижней границы контрольных данных возникают в основном за счет смещений, обусловленных выборочной схемой.

Метод наименьших квадратов при построении уравнения регрессии представлен на рис. 5.89. Типичные тренды для каж­ дой категории указаны на рис. 5.90. В следующей главе мы

169

Рис. 5.89. Соотношение между нелинейной регрессией, анализом поверхностей тренда, четырехмерными поверхностями тренда и множественной регрессией:

k — степень уравнения регрессии; т —число независимых переменных (раз­

мерность пространства)

снова рассмотрим обобщение метода построения линейной рег­ рессии для k независимых переменных. Конечно, это не геогра­ фические переменные, хотя часть из них и является таковыми.

ДВОЙНЫЕ РЯДЫ ФУРЬЕ

Уже отмечалось, что использование полиномиальных выра­ жений в качестве аппроксимирующих функций для поверхности тренда объясняется главным образом той легкостью, с которой их можно вычислить. Опыт показывает, что распределение мно­ гих геологических переменных, особенно абсолютных отметок структурных горизонтов, хорошо описывается поверхностями тренда сравнительно небольшого порядка. Однако нет никаких особых оснований для использования в качестве аппроксимиру­ ющих функций многочленов, так как возможны и другие вари­ анты выбора таких функций, которые нередко лучше подходят для тренд-анализа. В качестве таких функций широко исполь­ зуются двойные ряды Фурье.

170

Риг. '.30, Тренды от одной (а), двух (б) и трех (в) независимых переменных, полученные по полиномиальным уравнениям первой, второй и третьей сте­ пеней [37]

Терминология, используемая в теории двойных рядов Фурье,

п.нмствована главным образом

из электротехники и анализа

/'.•■сменных

'рядов. Необходимые

определения и понятия

были

л'Hi;.: в гл.

4, где мы рассмотрели простые ряды Фурье;

здесь

мы дадим соответствующие обобщения этих понятий. Наломнм. ито сложный осциллирующий пли периодический сигнал, подобный электрическому, может быть представлен в виде сум­ мы большого числа простых синусоидальных волн. Амплитуды и фазовые углы этих простых волновых форм можно опреде­ лить исходя из условия близости рядов гармоник синусоидаль­ ных и косинусоидальных волн к исходным данным. Аналогич­ ным образом сложную поверхность можно рассматривать как сумму двух взаимодействующих множеств двумерных синусои­ дальных волновых форм, каждая из которых содержит набор гармоник с различными амплитудами и фазовыми углами. В простейшем примере все гармоники в одном из направлений

171