Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 2

.pdf
Скачиваний:
0
Добавлен:
12.11.2023
Размер:
19.38 Mб
Скачать

а

б

Рис. 5.14. Значения статистик метода ближайшего соседа R для различных

схем расположения точек на картах (по Р. А. Ома, 1984):

а — толки сгруппированы в пять групп, У?=0,34; б — точки рассеяны случайно, /?=0,91; в — точки размещены по шестиугольной сети, R —2,15. Плотность то­ чек X одинакова для всех схем

расстояниями, равными нулю, до значения 1,0 для случайного распределения точек, т. е. до максимального значения 2,15. Последнее значение характеризует распределение, в котором среднее расстояние до ближайшей окрестности максимизирова­ но. Распределение имеет форму регулярной шестиугольной схе­ мы, в которой каждая точка равноудалена от шести других то­ чек. На рис. 5.14 представлены множества точек с различными значениями статистики ближайшего соседа, причем все имеют одну и ту же точечную плотность.

Проиллюстрируем применение метода ближайшего соседа, используя «карту», изображенную на рис. 5.15. Эта «карта» в действительности представляет собой полированную поверх-

32

Рис. 5.15. Схематическое представление полированной плиты анортозита, на которой показано расположение кристаллов магнетита

ность каменной облицовки фасада здания банка в универси­ тетском городке п служит интересным примером петрологиче­ ского изучения изверженных пород. Это черный анортозит, ко­ торый содержит мелкие рассеянные кристаллы магнетита. Преподаватели нередко используют эти плиты как наглядное пособие для различной тематики, включая и применение ма­ тематических методов в петрографии. При этом обычно посту­ лируется, что положение плиты совпадает с ее природной ори­ ентацией. Таким образом рассматривается вертикальная по­ верхность, нижней части которой соответствует нижний обрез плиты. Так называемая «карта» характеризует положение всех наблюдаемых на этой поверхности зерен магнетита. В табл. 5.4 приведены значения координат этих точек в сантиметрах, от­ считываемых от левого нижнего угла плиты. В данном случае задача заключается в получении ответа на вопрос: равномерно ли распределены зерна на поверхности плиты или же они обладают тенденцией к группировке? Кроме того, если распре­ деление зерен неравномерно, спрашивается, можно ли считать

3—и з

33

Т а б л и ц а 5.4

Коос-динаты г.шгнетиювых зергп на полированном анортозитовом слое

Расстояние

от нижнего

 

Расстояние <Jг нижнего

 

Расстояние от

нижн/то

левого углл

слоя, см

 

левого угла слои, см

 

левого угла слоя, см

Горизон-

1

Всотпкаль-

 

ГорПЗеЫ-

Вертикаль-

 

Горнзон-

 

1

 

 

 

тальное

11оо

 

талы ю с

нос

 

1 альиоа

 

 

;

 

 

 

 

 

 

 

1

 

86

 

27

34

 

50

13

2

 

41

 

28

76

 

51

25

4

 

3

 

37

14

 

56

12

4

 

15

 

37

6!

 

58

40

8

 

9 5

I

27

85

 

5.9

28

9

 

13

'

11

25

 

6 0

61

7

 

35

 

15

15

 

62

70

8

 

44

1

35

9 3

 

66

0

10

 

58

:

38

2 5

 

66

15

12

 

88

j

38

7

 

6 5

75

14

 

2

|

41

51

,

6 9

38

22

 

2

 

46

о

69

63

21

 

56

47

12

:

7 i

27

22

 

53

 

45

8 2

|

76

1

24

 

31

i

50

8 3

!

7 7

4

27

 

12

 

49

9 6

j

 

 

плотность зерен у нижнего края плиты превышающей плот­ ность у верхнего края? Получение ответа на подобные вопросы играет существенную роль при решении различных задач петрогенезпеа изверженных пород. Рассматриваемые в этой главе методы анализа данных могут оказаться весьма полезными. Проверку гипотезы о равномерном случайном распределении зерен магнетита можно провести с помощью одного из рас­ сматриваемых ранее способов — разделения на более дробные участки пли же с помощью метода ближайшего соседа. Вы­ числения можно проделать вручную, измерив расстояния прямо на рис. 5.15, пли вычислив их с помощью координат в табл. 5.4. Рнплай [65] (стр. 175—181) дает исчерпывающий анализ этих данных, используя различные методы.

РАСПРЕДЕЛЕНИЕ ПРЯМЫХ

Некоторые естественно встречающиеся в природе схемы сос­ тавлены из линий, таких, как лпнеаменты, видимые со спутни­ ков, следы трещин на выветренной поверхности гранитов, пли микроскопические структуры, наблюдаемые в шлифах дефор­ мированной породы. Так же, как множество точек может обра­ зовывать схему, которая изменяется от равномерной до класте­ ризованной с прочными связями, так и множество прямых мо­ жет обладать различными свойствам!:. Конечно, линии более

34

сложны, чем точки, так как они обладают длиной, ориентацией

к

местоположением. Соответственно их анализ более

труден,

и

статистические методы, пригодные для изучения

множеств

линий, менее развиты, чем методы, предназначенные для иссле­ дования схем точек. Изучению распределения длин линий по­ священо мало работ. Исключение составляют работы по логнонормальному распределению [2j. Очень небольшое число уче­

ных исследовали распределение

пространства между

линиями

в заданной схеме, т. е. решали

задачу,

аналогичную

методу

ближайшего соседа, в анализе

точечных

распределений [59,

19J. Значительно полнее освещен вопрос об ориентации линии, который будет рассмотрен в следующем параграфе.

Случайную схему линий можно определить как такую схе­ му, в которой каждое положение равновероятно может быть пересечено некоторой линией и любая ориентация секущей ли­ нии также равновероятна. Такие случайные схемы можно ге­ нерировать различными способами; одна из таких процедур состоит в выборе двух пар координат из таблицы случайных чисел и последующем проведении через соответствующие точки

прямой. Другой способ состоит в выборе произвольного

угла

на плоскости, проведении произвольного радиуса внутри

этого

угла, проведении на произвольном расстоянии от вершины угла

прямой, перпендикулярной к выбранному радиусу.

Повторяя

згу процедуру достаточное число раз,

получаем в

результате

схему статистически неразличимых линий.

 

Мы можем определить меру плотности линии, аналогичную

ранее определенной точечной плотности:

 

 

 

 

А,=2//А

 

(5.32)

Величина

2/ — общая

длина линий на

карте, имеющей пло­

щадь А;

К— параметр,

который определяет форму

пуассоновс­

кого распределения; как и следовало ожидать, пуассоновская модель описывает распределение многих параметров схемы, об­ разованной случайными линиями.

Распределение расстояний между парами линий можно ис­ следовать с помощью метода ближайшего соседа. Сначала про­ извольно выберем по одной точке на линиях карты. Из каждой точки по перпендикуляру к ближайшей линии вычисляется расстояние до нее. Среднее этих расстояний до ближайших со­

седей d есть среднее этих измерений, Эта

процедура проиллюст­

рирована на рис. 5.16.

_

Дэсн [19] определил среднее расстояние S по методу бли­ жайшего соседа для схемы случайных линий следующим обра­ зом:

6 = 0,31831/Я, (5.33)

35

Рис.

5.16.

 

Вычисление

расстояний

Рис. 5.17.

Случайное

расположение

между

линиями по

методу

ближай­

линий опробования

(пунктир), секу­

 

 

 

 

 

шего соседа.

 

 

 

щих схему линий на карте. Пересече­

Точка

р

вы бр ан а

сл уч ай н о

на

л и ­

ния последними линий

опробования

образуют

последовательность интер­

нии X .

 

П ун к т и р н ы е

линии

a,

h п

с

 

валов, для

которых

можно проверить

эт о п е р п ен д и к ул я ры ,

п р ов ед ен н ы е из

гипотезу о случайности

точки

р

 

к

б л и ж а й ш и м

лин и ям . К р а т ­

ч ай ш ая

из

н их с — р асст оя н и е

д о

б л и ­

 

 

 

 

ж а й ш е г о

со с е д а линии

X .

П р о ц е с с

п о ­

 

 

 

 

в тор я ется

с

ц елью

н а х о ж д е н и я

р а с ­

 

 

 

 

стояни й

 

по

 

м е т о д у

б л и ж а й ш е г о с о с е ­

 

 

 

 

 

 

 

д а

д л я всех

линий

 

 

 

 

 

 

а также дисперсию этого среднего:

4 = 0 , 1 0 1 3 2 / ^ . ( 5 . 3 4 )

Используя эту дисперсию и число линий в схеме, можно найти стандартное отклонение нашей оценки среднего расстоя­ ния по методу ближайшего соседа. Стандартное отклонение оп­ ределено формулой

Se = ^ y ° f ! n -

(5-35)

Она позволяет нам вычислить простую Z-статнстику для про­ верки значимости разности мел<ду ожидаемым и наблюденным средним расстоянием, вычисленным по методу ближайшего соседа:

Z =

( 5 . 3 6 )

Критерий является двусторонним. Если величина Z не значи­ ма, то можно заключить, что наблюденная схема линий не от­ личима от схемы, порожденной случайным (пуассоновским) распределением. Мы можем также ввести индекс ближайшего соседа, идентичный тому, который использовался для точечных схем, взяв отношение наблюденного и ожидаемого среднего

расстояний по методу ближайшего соседа, или d/б. Индекс ин­

36

терпретируется совершенно аналогично индексу для точечных схем.

Этот критерий пригоден для множеств как прямых, так и искривленных линий при условии, что эти линии не часто меня­ ют направление. Значит, линии должны быть по крайней мере в полтора раза длиннее, чем среднее расстояние между ними. Если число линий на одной карте мало, то оцененную плотность рекомендуется снабдить множителем (п—1 )/п, где п — число линий в схеме. Оценка плотности линий поэтому такова:

А= fe—fl/i

(5.37)

Простой метод исследования множества линий на карте со­ стоит в преобразовании двумерной схемы в одномерную после­ довательность. Мы можем сделать это, проведя случайно ли­ нию на карте и отмечая точки, в которых эта линия пересекает линии заданного множества. Распределение интервалов между точками пересечения вдоль проведенной линии дает информа­ цию о пространственной схеме. Мы можем применить к иссле­ дованию этой одномерной последовательности методы, изло­ женные в гл. 4. Если одна секущая не даст достаточного ко­ личества пересечений для того, чтобы можно было применить одномерные критерии, то можно провести некоторую другую случайно ориентированную линию и т. д. (рис. 5J7). Извилис­ тый путь секущей линии напоминает случайное блуждание, и последовательность пересечений может рассматриваться как последовательность, расположенная вдоль одной прямой линии. Этот и другие методы исследования плотности схемы линий рассмотрены в работе [29].

АНАЛИЗ НАПРАВЛЕННЫХ ДАННЫХ

 

Направленные

данные — важная категория

геологической

информации. Все

объекты, такие, как плоскости

напластова­

ний, складчатые поверхности и трещины, характеризуются за­ леганием, выраженным простиранием пластов н их наклоном. Ледниковые трещины, маркирующие горизонты, ископаемые раковины и отшлифованная водой галька имеют преобладаю­ щие направления ориентации. Фотографии, полученные с воз­ духа и спутников, также показывают наличие ориентированных линейных схем. Указанные объекты могут быть исследованы количественными методами, наподобие измерений других гео­ логических свойств, однако необходимо использовать специ­ альные статистики, отражающие циклическую (или сферичес­ кую) природу направленных данных.

Учитывая практику географов, мы должны различать на­ правленные и ориентированные объекты. Предположим, что

37

автомобиль движется на север вдоль шоссе; движение автомо­ биля имеет направление, в то время как шоссе само имеет

только ориентацию север — юг. Простирания слоев

пород и

прослеживание складок — примеры ориентированных

геологи­

ческих наблюдений, в то время как друмлины и некоторые ис­ копаемые, такие, как сильно скрученные гастроподы, имеют ярко выраженные направленные характеристики.

Мы можем также выделить наблюдения, которые удобно изображать точками на окружности, или наблюдения, естест­ венно представленные на сфере, например, метаморфические структуры. Первые из упомянутых данных удобно изображать на диаграмме, имеющей форму циклической гистограммы, вто­ рые— изображаются точками в проекции на полусферу. Хотя геологи многие годы представляют направленные данные в та­ ком виде, они не разработали формальных статистических про­ цедур для проверки истинности заключений, которые извлека­ лись из этих диаграмм. Такое положение достойно сожаления нс только потому, что эти критерии полезны сами по себе, но п потому, что развитие многих из этих методов было инспири­ ровано первоначально проблемами наук о Земле.

На рис. 5.)8 представлена карта трещиноватости ледников,

измеренной па малой площади в Южной

Финляндии (табл.

5.5'. Направления, указанные штрихами,

можно изобразить

единичными векторами или же на окружности единичного ра­

диуса (рис.

5.19, а). Если

окружность

разбить

на сегменты н

подсчитать

число векторов

в каждом

сегменте,

то результат

ч

ч

 

I

Рис. 5.18. Карта, представляющая направления штриховки ледника в южной части Финляндии (51 измерение) на площади 35 км2

38

Т а б л и ц а 5 .5

Вектор направлений штриховки ледника, измеренный на площади

2 Ю ж н ом Ф и н л я н ди и

(зн а ч е н и я даны

в г р а д у с а х ,

отсчет

в ел ся против

часов ой стрелк и , начиная с севера)

23

123

145

27

125

145

53

126

146

58

126

153

64

126

155

8 3

127

155

85

127

155

88

128

157

9 3

128

163

9 9

129

165

100

132

171

105

132

172

113

132

179

и з

134

181

114

135

186

117

137

190

121

144

2 12

можно представить в виде розы или циклической гистограммы (см. рис. 5.19,6). Однако для того, чтобы вычислить статисти­ ки, которые дают характеристики всего множества векторов, мы должны работать непосредственно с самими измерениями. (Необходимо отметить что следуя соглашению между геолога­ ми, мы измеряем углы против часовой стрелки от положитель­ ного направления оси У, т. е. от направления на север). В боль­ шинстве работ по статистике направленных данных углы изме­ ряются против часовой стрелки от положительного направле­ ния оси X, т. е. направления на еосток.

Главное направление в некотором множестве векторов мож­

но найти,

вычисляя результирующий

вектор — результант.

Пусть X п

Y — координаты

конца единичного вектора, направ­

ление которого задается углом 0:

 

 

Xi

COS 0;,

QQ\

 

Yi = sin 0,-.

(5-38)

Такие три вектора представлены на рис. 5.20. Также показан результирующий вектор, полученный суммированием синусов и

косинусов индивидуальных векторов:

П

\COS 9;,

tllni’• 1

i~ i

П

(5.39)

Y r = У1 sin Oj. / =ы

39

3 6 0 ’

Рис. 5.19. Направления штриховки ледника, изображенные на рис. 5.18:

а — направлен и я, п р едс тав л ен н ы е как

единичны е

векторы; б — направлен и я,

п р едс тав л ен н ы е как

р о за - д и а г р а м м а ,

на

к оторой ук азан ы числа в екторов в н у т ­

ри

п осл ед ов ат ел ь н ы х

10 -градуен ы х

и нтервалов

Рис. 5.20. Определение среднего направления множества единичных векторов:

а — три

вектора, взяты е

с рис. 5.18; б — вектор R ,

п олучен н ы й к о м б и н и р о в а н и ­

ем

т р ех еди ни чн ы х

векторов . П о р я д о к к ом би

н и р ован и я н есущ еств ен

Из результирующего вектора можно получить среднее направление 0, которое является угловым средним всех векто­ ров выборки. Оно совершенно аналогично среднему значению множества скалярных измерений:

п

п

 

6 = tan-1(Yr/ x r) = tan-1(

sin 6f j ^Гсоз0г).

(5.40)

iI

l~ I

 

Очевидно, величина или длина результирующего вектора зависит отчасти от вклада дисперсии выборки векторов, но также и от числа векторов. Для сравнения результирующих векторов выборок различного объема их необходимо привести к стандартному виду путем деления координат результирую­ щего вектора на число наблюдений:

 

П

 

С ^ Х г/п -= J - У

cos о,.,

 

п

i

^1

(5.41)

 

п

sin О,.

 

S ■- YJn ----

У

 

I ~ I

Заметим, что эти координаты также определяют центроид ко­ нечных точек заданных единичных векторов.

Результирующий вектор дает инфрмацию не только о сред­ нем направлении некоторого множества векторов, но и о рас­ положении векторов относительно среднего. На рис. 5.21, а представлены три вектора, которые только немного отклоня­ ются от среднего направления. Результирующий вектор по дли­ не почти равен сумме длин трех этих векторов. Наоборот, три вектора, представленные на рис. 5.21,6, сильно разбросаны; их результирующий вектор очень короткий. Длина результиру­ ющего вектора, обозначаемая R, определена по теореме Пифа­ гора:

Г

п

п

R - 1 Х Г2 - V ; --- ш /

( V co s0 ,)'+

sin 0|)‘ . (5.42)

V

' гд1

iT 1

Длину результирующего вектора можно стандартизировать делением на число наблюдений. Стандартизованный результи­ рующий вектор по длине равен также квадратному корню из суммы квадратов стандартизованных координат концевых то­ чек:

R = R/n = ] / с 2 + S 2 .

(5.43)

Величина R называется средней длиной результирующего век-

41