книги / Статистический анализ данных в геологии. Кн. 2
.pdfа |
б |
Рис. 5.14. Значения статистик метода ближайшего соседа R для различных
схем расположения точек на картах (по Р. А. Ома, 1984):
а — толки сгруппированы в пять групп, У?=0,34; б — точки рассеяны случайно, /?=0,91; в — точки размещены по шестиугольной сети, R —2,15. Плотность то чек X одинакова для всех схем
расстояниями, равными нулю, до значения 1,0 для случайного распределения точек, т. е. до максимального значения 2,15. Последнее значение характеризует распределение, в котором среднее расстояние до ближайшей окрестности максимизирова но. Распределение имеет форму регулярной шестиугольной схе мы, в которой каждая точка равноудалена от шести других то чек. На рис. 5.14 представлены множества точек с различными значениями статистики ближайшего соседа, причем все имеют одну и ту же точечную плотность.
Проиллюстрируем применение метода ближайшего соседа, используя «карту», изображенную на рис. 5.15. Эта «карта» в действительности представляет собой полированную поверх-
32
Рис. 5.15. Схематическое представление полированной плиты анортозита, на которой показано расположение кристаллов магнетита
ность каменной облицовки фасада здания банка в универси тетском городке п служит интересным примером петрологиче ского изучения изверженных пород. Это черный анортозит, ко торый содержит мелкие рассеянные кристаллы магнетита. Преподаватели нередко используют эти плиты как наглядное пособие для различной тематики, включая и применение ма тематических методов в петрографии. При этом обычно посту лируется, что положение плиты совпадает с ее природной ори ентацией. Таким образом рассматривается вертикальная по верхность, нижней части которой соответствует нижний обрез плиты. Так называемая «карта» характеризует положение всех наблюдаемых на этой поверхности зерен магнетита. В табл. 5.4 приведены значения координат этих точек в сантиметрах, от считываемых от левого нижнего угла плиты. В данном случае задача заключается в получении ответа на вопрос: равномерно ли распределены зерна на поверхности плиты или же они обладают тенденцией к группировке? Кроме того, если распре деление зерен неравномерно, спрашивается, можно ли считать
3—и з |
33 |
Т а б л и ц а 5.4
Коос-динаты г.шгнетиювых зергп на полированном анортозитовом слое
Расстояние |
от нижнего |
|
Расстояние <Jг нижнего |
|
Расстояние от |
нижн/то |
||
левого углл |
слоя, см |
|
левого угла слои, см |
|
левого угла слоя, см |
|||
Горизон- |
1 |
Всотпкаль- |
|
ГорПЗеЫ- |
Вертикаль- |
|
Горнзон- |
|
1 |
|
|
|
|||||
тальное |
11оо |
|
талы ю с |
нос |
|
1 альиоа |
|
|
|
; |
|
|
|
|
|
|
|
1 |
|
86 |
|
27 |
34 |
|
50 |
13 |
2 |
|
41 |
|
28 |
76 |
|
51 |
25 |
4 |
|
3 |
|
37 |
14 |
|
56 |
12 |
4 |
|
15 |
|
37 |
6! |
|
58 |
40 |
8 |
|
9 5 |
I |
27 |
85 |
|
5.9 |
28 |
9 |
|
13 |
' |
11 |
25 |
|
6 0 |
61 |
7 |
|
35 |
|
15 |
15 |
|
62 |
70 |
8 |
|
44 |
1 |
35 |
9 3 |
|
66 |
0 |
10 |
|
58 |
: |
38 |
2 5 |
|
66 |
15 |
12 |
|
88 |
j |
38 |
7 |
|
6 5 |
75 |
14 |
|
2 |
| |
41 |
51 |
, |
6 9 |
38 |
22 |
|
2 |
|
46 |
о |
69 |
63 |
|
21 |
|
56 |
■ |
47 |
12 |
: |
7 i |
27 |
22 |
|
53 |
|
45 |
8 2 |
| |
76 |
1 |
24 |
|
31 |
i |
50 |
8 3 |
! |
7 7 |
4 |
27 |
|
12 |
|
49 |
9 6 |
j |
|
|
плотность зерен у нижнего края плиты превышающей плот ность у верхнего края? Получение ответа на подобные вопросы играет существенную роль при решении различных задач петрогенезпеа изверженных пород. Рассматриваемые в этой главе методы анализа данных могут оказаться весьма полезными. Проверку гипотезы о равномерном случайном распределении зерен магнетита можно провести с помощью одного из рас сматриваемых ранее способов — разделения на более дробные участки пли же с помощью метода ближайшего соседа. Вы числения можно проделать вручную, измерив расстояния прямо на рис. 5.15, пли вычислив их с помощью координат в табл. 5.4. Рнплай [65] (стр. 175—181) дает исчерпывающий анализ этих данных, используя различные методы.
РАСПРЕДЕЛЕНИЕ ПРЯМЫХ
Некоторые естественно встречающиеся в природе схемы сос тавлены из линий, таких, как лпнеаменты, видимые со спутни ков, следы трещин на выветренной поверхности гранитов, пли микроскопические структуры, наблюдаемые в шлифах дефор мированной породы. Так же, как множество точек может обра зовывать схему, которая изменяется от равномерной до класте ризованной с прочными связями, так и множество прямых мо жет обладать различными свойствам!:. Конечно, линии более
34
сложны, чем точки, так как они обладают длиной, ориентацией
к |
местоположением. Соответственно их анализ более |
труден, |
и |
статистические методы, пригодные для изучения |
множеств |
линий, менее развиты, чем методы, предназначенные для иссле дования схем точек. Изучению распределения длин линий по священо мало работ. Исключение составляют работы по логнонормальному распределению [2j. Очень небольшое число уче
ных исследовали распределение |
пространства между |
линиями |
|
в заданной схеме, т. е. решали |
задачу, |
аналогичную |
методу |
ближайшего соседа, в анализе |
точечных |
распределений [59, |
19J. Значительно полнее освещен вопрос об ориентации линии, который будет рассмотрен в следующем параграфе.
Случайную схему линий можно определить как такую схе му, в которой каждое положение равновероятно может быть пересечено некоторой линией и любая ориентация секущей ли нии также равновероятна. Такие случайные схемы можно ге нерировать различными способами; одна из таких процедур состоит в выборе двух пар координат из таблицы случайных чисел и последующем проведении через соответствующие точки
прямой. Другой способ состоит в выборе произвольного |
угла |
на плоскости, проведении произвольного радиуса внутри |
этого |
угла, проведении на произвольном расстоянии от вершины угла
прямой, перпендикулярной к выбранному радиусу. |
Повторяя |
|||
згу процедуру достаточное число раз, |
получаем в |
результате |
||
схему статистически неразличимых линий. |
|
|||
Мы можем определить меру плотности линии, аналогичную |
||||
ранее определенной точечной плотности: |
|
|
||
|
|
А,=2//А |
|
(5.32) |
Величина |
2/ — общая |
длина линий на |
карте, имеющей пло |
|
щадь А; |
К— параметр, |
который определяет форму |
пуассоновс |
кого распределения; как и следовало ожидать, пуассоновская модель описывает распределение многих параметров схемы, об разованной случайными линиями.
Распределение расстояний между парами линий можно ис следовать с помощью метода ближайшего соседа. Сначала про извольно выберем по одной точке на линиях карты. Из каждой точки по перпендикуляру к ближайшей линии вычисляется расстояние до нее. Среднее этих расстояний до ближайших со
седей d есть среднее этих измерений, Эта |
процедура проиллюст |
рирована на рис. 5.16. |
_ |
Дэсн [19] определил среднее расстояние S по методу бли жайшего соседа для схемы случайных линий следующим обра зом:
6 = 0,31831/Я, (5.33)
35
Рис. |
5.16. |
|
Вычисление |
расстояний |
Рис. 5.17. |
Случайное |
расположение |
||||||||
между |
линиями по |
методу |
ближай |
линий опробования |
(пунктир), секу |
||||||||||
|
|
|
|
|
шего соседа. |
|
|
|
щих схему линий на карте. Пересече |
||||||
Точка |
р |
вы бр ан а |
сл уч ай н о |
на |
л и |
ния последними линий |
опробования |
||||||||
образуют |
последовательность интер |
||||||||||||||
нии X . |
|
П ун к т и р н ы е |
линии |
a, |
h п |
с — |
|||||||||
|
валов, для |
которых |
можно проверить |
||||||||||||
эт о п е р п ен д и к ул я ры , |
п р ов ед ен н ы е из |
||||||||||||||
гипотезу о случайности |
|||||||||||||||
точки |
р |
|
к |
б л и ж а й ш и м |
лин и ям . К р а т |
||||||||||
ч ай ш ая |
из |
н их с — р асст оя н и е |
д о |
б л и |
|
|
|
|
|||||||
ж а й ш е г о |
со с е д а линии |
X . |
П р о ц е с с |
п о |
|
|
|
|
|||||||
в тор я ется |
с |
ц елью |
н а х о ж д е н и я |
р а с |
|
|
|
|
|||||||
стояни й |
|
по |
|
м е т о д у |
б л и ж а й ш е г о с о с е |
|
|
|
|
||||||
|
|
|
д а |
д л я всех |
линий |
|
|
|
|
|
|
а также дисперсию этого среднего:
4 = 0 , 1 0 1 3 2 / ^ . ( 5 . 3 4 )
Используя эту дисперсию и число линий в схеме, можно найти стандартное отклонение нашей оценки среднего расстоя ния по методу ближайшего соседа. Стандартное отклонение оп ределено формулой
Se = ^ y ° f ! n - |
(5-35) |
Она позволяет нам вычислить простую Z-статнстику для про верки значимости разности мел<ду ожидаемым и наблюденным средним расстоянием, вычисленным по методу ближайшего соседа:
Z = |
( 5 . 3 6 ) |
Критерий является двусторонним. Если величина Z не значи ма, то можно заключить, что наблюденная схема линий не от личима от схемы, порожденной случайным (пуассоновским) распределением. Мы можем также ввести индекс ближайшего соседа, идентичный тому, который использовался для точечных схем, взяв отношение наблюденного и ожидаемого среднего
расстояний по методу ближайшего соседа, или d/б. Индекс ин
36
терпретируется совершенно аналогично индексу для точечных схем.
Этот критерий пригоден для множеств как прямых, так и искривленных линий при условии, что эти линии не часто меня ют направление. Значит, линии должны быть по крайней мере в полтора раза длиннее, чем среднее расстояние между ними. Если число линий на одной карте мало, то оцененную плотность рекомендуется снабдить множителем (п—1 )/п, где п — число линий в схеме. Оценка плотности линий поэтому такова:
А= fe—fl/i |
(5.37) |
Простой метод исследования множества линий на карте со стоит в преобразовании двумерной схемы в одномерную после довательность. Мы можем сделать это, проведя случайно ли нию на карте и отмечая точки, в которых эта линия пересекает линии заданного множества. Распределение интервалов между точками пересечения вдоль проведенной линии дает информа цию о пространственной схеме. Мы можем применить к иссле дованию этой одномерной последовательности методы, изло женные в гл. 4. Если одна секущая не даст достаточного ко личества пересечений для того, чтобы можно было применить одномерные критерии, то можно провести некоторую другую случайно ориентированную линию и т. д. (рис. 5J7). Извилис тый путь секущей линии напоминает случайное блуждание, и последовательность пересечений может рассматриваться как последовательность, расположенная вдоль одной прямой линии. Этот и другие методы исследования плотности схемы линий рассмотрены в работе [29].
АНАЛИЗ НАПРАВЛЕННЫХ ДАННЫХ |
|
|
Направленные |
данные — важная категория |
геологической |
информации. Все |
объекты, такие, как плоскости |
напластова |
ний, складчатые поверхности и трещины, характеризуются за леганием, выраженным простиранием пластов н их наклоном. Ледниковые трещины, маркирующие горизонты, ископаемые раковины и отшлифованная водой галька имеют преобладаю щие направления ориентации. Фотографии, полученные с воз духа и спутников, также показывают наличие ориентированных линейных схем. Указанные объекты могут быть исследованы количественными методами, наподобие измерений других гео логических свойств, однако необходимо использовать специ альные статистики, отражающие циклическую (или сферичес кую) природу направленных данных.
Учитывая практику географов, мы должны различать на правленные и ориентированные объекты. Предположим, что
37
автомобиль движется на север вдоль шоссе; движение автомо биля имеет направление, в то время как шоссе само имеет
только ориентацию север — юг. Простирания слоев |
пород и |
прослеживание складок — примеры ориентированных |
геологи |
ческих наблюдений, в то время как друмлины и некоторые ис копаемые, такие, как сильно скрученные гастроподы, имеют ярко выраженные направленные характеристики.
Мы можем также выделить наблюдения, которые удобно изображать точками на окружности, или наблюдения, естест венно представленные на сфере, например, метаморфические структуры. Первые из упомянутых данных удобно изображать на диаграмме, имеющей форму циклической гистограммы, вто рые— изображаются точками в проекции на полусферу. Хотя геологи многие годы представляют направленные данные в та ком виде, они не разработали формальных статистических про цедур для проверки истинности заключений, которые извлека лись из этих диаграмм. Такое положение достойно сожаления нс только потому, что эти критерии полезны сами по себе, но п потому, что развитие многих из этих методов было инспири ровано первоначально проблемами наук о Земле.
На рис. 5.)8 представлена карта трещиноватости ледников,
измеренной па малой площади в Южной |
Финляндии (табл. |
5.5'. Направления, указанные штрихами, |
можно изобразить |
единичными векторами или же на окружности единичного ра
диуса (рис. |
5.19, а). Если |
окружность |
разбить |
на сегменты н |
подсчитать |
число векторов |
в каждом |
сегменте, |
то результат |
ч |
ч |
|
I
Рис. 5.18. Карта, представляющая направления штриховки ледника в южной части Финляндии (51 измерение) на площади 35 км2
38
Т а б л и ц а 5 .5
Вектор направлений штриховки ледника, измеренный на площади
2 Ю ж н ом Ф и н л я н ди и |
(зн а ч е н и я даны |
|
в г р а д у с а х , |
отсчет |
в ел ся против |
часов ой стрелк и , начиная с севера) |
||
23 |
123 |
145 |
27 |
125 |
145 |
53 |
126 |
146 |
58 |
126 |
153 |
64 |
126 |
155 |
8 3 |
127 |
155 |
85 |
127 |
155 |
88 |
128 |
157 |
9 3 |
128 |
163 |
9 9 |
129 |
165 |
100 |
132 |
171 |
105 |
132 |
172 |
113 |
132 |
179 |
и з |
134 |
181 |
114 |
135 |
186 |
117 |
137 |
190 |
121 |
144 |
2 12 |
можно представить в виде розы или циклической гистограммы (см. рис. 5.19,6). Однако для того, чтобы вычислить статисти ки, которые дают характеристики всего множества векторов, мы должны работать непосредственно с самими измерениями. (Необходимо отметить что следуя соглашению между геолога ми, мы измеряем углы против часовой стрелки от положитель ного направления оси У, т. е. от направления на север). В боль шинстве работ по статистике направленных данных углы изме ряются против часовой стрелки от положительного направле ния оси X, т. е. направления на еосток.
Главное направление в некотором множестве векторов мож
но найти, |
вычисляя результирующий |
вектор — результант. |
|
Пусть X п |
Y — координаты |
конца единичного вектора, направ |
|
ление которого задается углом 0: |
|
||
|
Xi |
COS 0;, |
QQ\ |
|
Yi = sin 0,-. |
(5-38) |
Такие три вектора представлены на рис. 5.20. Также показан результирующий вектор, полученный суммированием синусов и
косинусов индивидуальных векторов:
П
\COS 9;,
tllni’• 1
i~ i
П
(5.39)
Y r = У1 sin Oj. / =ы
39
0°
3 6 0 ’
Рис. 5.19. Направления штриховки ледника, изображенные на рис. 5.18:
а — направлен и я, п р едс тав л ен н ы е как |
единичны е |
векторы; б — направлен и я, |
||
п р едс тав л ен н ы е как |
р о за - д и а г р а м м а , |
на |
к оторой ук азан ы числа в екторов в н у т |
|
ри |
п осл ед ов ат ел ь н ы х |
10 -градуен ы х |
и нтервалов |
Рис. 5.20. Определение среднего направления множества единичных векторов:
а — три |
вектора, взяты е |
с рис. 5.18; б — вектор R , |
п олучен н ы й к о м б и н и р о в а н и |
ем |
т р ех еди ни чн ы х |
векторов . П о р я д о к к ом би |
н и р ован и я н есущ еств ен |
Из результирующего вектора можно получить среднее направление 0, которое является угловым средним всех векто ров выборки. Оно совершенно аналогично среднему значению множества скалярных измерений:
п |
п |
|
6 = tan-1(Yr/ x r) = tan-1( |
sin 6f j ^Гсоз0г). |
(5.40) |
i—I |
l~ I |
|
Очевидно, величина или длина результирующего вектора зависит отчасти от вклада дисперсии выборки векторов, но также и от числа векторов. Для сравнения результирующих векторов выборок различного объема их необходимо привести к стандартному виду путем деления координат результирую щего вектора на число наблюдений:
|
П |
|
|
С ^ Х г/п -= J - У |
cos о,., |
|
|
п |
i |
^1 |
(5.41) |
|
п |
sin О,. |
|
S ■- YJn ---- |
У |
|
I ~ I
Заметим, что эти координаты также определяют центроид ко нечных точек заданных единичных векторов.
Результирующий вектор дает инфрмацию не только о сред нем направлении некоторого множества векторов, но и о рас положении векторов относительно среднего. На рис. 5.21, а представлены три вектора, которые только немного отклоня ются от среднего направления. Результирующий вектор по дли не почти равен сумме длин трех этих векторов. Наоборот, три вектора, представленные на рис. 5.21,6, сильно разбросаны; их результирующий вектор очень короткий. Длина результиру ющего вектора, обозначаемая R, определена по теореме Пифа гора:
Г |
п |
п |
R - 1 Х Г2 - V ; --- ш / |
( V co s0 ,)'+ |
sin 0|)‘ . (5.42) |
V |
' гд1 |
iT 1 |
Длину результирующего вектора можно стандартизировать делением на число наблюдений. Стандартизованный результи рующий вектор по длине равен также квадратному корню из суммы квадратов стандартизованных координат концевых то чек:
R = R/n = ] / с 2 + S 2 . |
(5.43) |
Величина R называется средней длиной результирующего век-
41