книги / Статистический анализ данных в геологии. Кн. 2
.pdfная для достижения хорошего предсказания на неконтролируе мых площадях, а на втором — изменение сети в непосредствен ной окрестности контрольных точек. Полученная сложная по верхность по меньшей мере частично удовлетворяет различным поставленным условиям. Однако она имеет специфические чер ты в малых окрестностях каждой контрольной точки, которые не встречаются больше нигде на этой карте.
Карта топографических данных, приведенная в табл. 5.11, представлена на рис. 5.58, построенном по программе, которая дает регулярную сеть. В этом примере математическая модель поверхности содержит 63 строки и 63 столбца; каждый узел сети был оценен с помощью проекционного алгоритма, учиты вающего примерно 16 контрольных точек. Контрольные точки взвешивались в соответствии с их расстоянием от узлов сети с помощью функций, заданных уравнением (5.68). Сравним эту карту с двумя картами рис. 5.51, полученными по методу треугольников, и картой рис. 5.59, построенной вручную работ ником картографической службы. Имеются расхождения меж ду двумя картами, построенными ЭВМ, и картой, построенной вручную, которые отражают различия в соответствующих мо делях и также тот факт, что человек может учесть информа-
Рис. 5.59. Карта в изолиниях, построенная по топографическим данным вручную.
Отметим увеличение влияния русел на форму изолиний
102
цию о текущих эффектах на топографической карте. Эта до полнительная информация недоступна никакой программе по строения изолиний. Риплай [63] дает несколько дополнитель ных примеров построения карт по тем же данным с примене нием других алгоритмов.
СКОЛЬЗЯЩИЕ СРЕДНИЕ
Несмотря на то что некоторые нз рассмотренных методов применялись в геологии рудных месторождений, опенка запа сов полезных ископаемых и контроль качества разработок представляют специальные задачи. Для их решения были раз работаны математические и статистические методы оценки за пасов, стоящие несколько в стороне от основного направления развития математической геологии. В США статистика, исполь зуемая в геологии рудных месторождений, следовала общей линии развития традиционного статистического анализа; осо бенно дисперсионного (несколько примеров и подробная биб лиография приводятся в книге Коха и Линка [45]. Однако в Южной Африке и Франции теория оценки запасов и их пред сказание развивались по независимому пути, который мы рас смотрим позже.
В пластовом осадочном рудном теле содержание рудного компонента распределено нормально. Это значит, что место рождение характеризуется определенным средним содержани ем полезного компонента, а его содержание в отдельных про бах распределено более или менее симметрично относительно этого среднего значения с убыванием относительной частоты появления к крайним значениям. Для анализа проб из таких месторождений можно использовать обычные параметрические статистики, а регрессионные процедуры оказываются ценным методом предсказания и оценки запасов. Однако характерис тики месторождений драгоценных минералов или редких ме таллов чаще всего не подчиняются этому закону распределе ния. Пробы, взятые с поверхности пли из буровой скважины, характеризуются крайними значениями, которые являются не обычными в их пространственном распределении. Вообще «хо рошим» статистическим переменным свойственно отсутствие закономерности поведения.
На рис. 5.60, а представлены значения содержаний серебра в пробах по штольне одного из мексиканских серебряных руд ников. Две характерные черты видны сразу: значения растут быстрее, чем линейная функция (богатые участки во много раз богаче, чем бедные), и изменчивость увеличивается по мере увеличения содержания. В богатой части штольни изменения значений более сильные, чем это характерно для интервала значений в бедных частях той же штольни. Суммируя, можно
ЮЗ
400 г а
!0м
6
Рис. 5.60. Изменчивость содержаний серебра вдоль шт'ольии рудника в Мек сике:
а — с о д е р ж а н и я , п р едстав л ен н ы е |
в обы чн ом м асш та б е; б — с о д е р ж а н и я , п р е д |
став л ен н ы е в |
л огар и ф м и ческ ом м а с ш т а б е |
сказать, что эта зависимость сортности руды от расстояния характеризуется экспоненциальным законом, а дисперсия яв ляется гетероседастичной.
В этом случае данные можно преобразовать, взяв логариф мы значений содержаний рудного компонента. Тогда экспонен циальная кривая тренда превратится в прямую, а гетероседастичная дисперсия относительно тренда станет постоянной. Логарифмы тех же данных представлены на рис. 5.60, б.
Другая особенность многих рудных месторождений заклю чается в том, что среднее содержание полезного компонента в блоке чаще всего не зависит от размера блока, если превы шен некоторый минимальный объем. Однако часто оказыва лось, что дисперсия содержаний в пробах руды находится в обратной связи с размером блока, уменьшаясь по мере увели чения объема пробы. Вероятно, это приводит к задаче оценки запасов, так как объемы проб, на основании которых должны быть получены оценки, во много раз меньше, чем блоки руды, которые затем будут отработаны. (Этот вопрос рассматрива ют Кох н Линк [45J.) Поэтому дисперсия содержаний в про-
104
бах может оказаться настолько высокой, что реальную оценку содержаний руды в блоках дать нельзя. Для получения оценок с меньшей дисперсией можно воспользоваться методом сколь зящего среднего по выборке в надежде усреднить большую из менчивость, связанную с отдельными пробами.
Двумерные методы скользящего среднего являются обоб щением процедур сглаживания данных, рассмотренных в гл. 4 (см. книгу 1). В общем случае требуется оценить переменную в ряде точек сети или приписать значения последовательно примыкающим друг к другу квадратам пли прямоугольникам на карте. Данные, на основании которых делаются опенки, разбросаны на площади карты и могут лежать или не лежать в узлах сети. Фигура, аналогичная сглаживающему интервалу в анализе временного тренда, располагается так, чтобы ее центр лежал в точке, в которой должна быть получена оценка. Всем данным точкам, лежащим внутри этой фигуры, например квадрата или круга, приписываются некоторым образом веса, которые затем используются при получении оценки в централь ной точке. Простейшая схема метода скользящего среднего состоит в том, что оцениваемой точке приписывается значение, равное среднему арифметическому всех наблюдений, лежащих
внутри рассматриваемой |
фигуры. Фигура затем |
передвигается |
в следующий узел сетки, |
и процесс повторяется |
снова. Когда |
будут вычислены оценки для одной строки или столбца сети, переходят к следующей строке или столбцу, и так до тех пор, пока вся площадь карты не будет покрыта полностью.
Общую модель любого метода скользящего среднего можно записать в следующем виде:
П
(5.69)
т. с. оцениваемое значение Уц строится на основании взвешен ной суммы Yk соседних наблюдений. Вид весовой функции' из меняется от одной схемы скользящего среднего к другой. На пример, в программе построения изолиний использовано сколь зящее среднее с весами, равными обратным величинам рас
стояний точек от Yij. Можно использовать столь же простую схему выборочного среднего, как схема сглаживания функций, изложенная в гл. 4. Очевидно, возможны также и другие схемы взвешивания.
Большинство методов скользящего среднего так пли иначе использует расстояния от оцениваемой точки до оценивающих точек. В программе построения изолиний измеряется расстоя ние до п ближайших точек и каждому приписываются соот ветствующие веса. Методы, аналогичные одномерным сглажи
105
вающим процедурам, требуют, чтобы данные были расположен
ны по сетке. Тогда пространственное соотношение между Уц и каждым значением У внутри скользящего интервала оказыва ется известным. В этом случае веса остаются постоянными для эквивалентных точек Yh по мере того, как поверхность сколь
зящего среднего дает последовательные |
оценки значений Уц. |
|
В третьем методе определяются ряды областей пли |
блоков, |
|
прилегающих к оцениваемой точке. Все |
наблюдения |
в преде |
лах каждого из них усредняются, затем средним по блокам У приписываются веса, которые используются для получения
оценки Yij. Если в каждом блоке содержится много наблюде ний, то, совершая лишь незначительную ошибку, можно счи тать, что среднее значение соответствует центру блока. Так как центры блоков всегда расположены на фиксированном расстоя нии от оцениваемой точки, то можно использовать постоянные весовые функции. Этот метод имеет значительные преимуще ства в том случае, если оценки строятся на основании крайне нерегулярной сети контрольных значений. Мы детально оста новимся на рассмотрении метода скользящего среднего треть его типа, так как это — один из наиболее перспективных мето дов, который широко использовался для оценки некоторых крупных рудных месторождений Северной Америки.
Скользящие взвешенные средние, полученные по средним значениям в блоках
Даже в том случае, если минерализированная жила очень мала, в процессе разработки месторождения должен быть вы бран блок породы соответствующего размера. Минимальный размер этого блока определяется методом отработки и зави сит от размеров оборудования и строения породы. Хотя в про цессе отработки блоков содержание полезного компонента уменьшается за счет разубожнвания пустой породой, техноло гия разработок делает это неизбежным. Все перечисленные факторы определяют минимальный размер блока, содержание в котором мы хотим оценить. Например, бессмысленно оцени вать содержание руды в одной кубической единице объема, если размер блока выработки составляет 100 кубических еди ниц. В разработках, в которых используется метод взвешенно го усреднения по блокам, наименьшая длина в каждом измере нии, используемая на практике, составляет примерно 100 фу тов. Эта наименьшая практическая единица, используемая в разработках, меняется от одного месторождения к другому и, вероятно, является наибольшей при разработке тел вкраплен ных руд и наименьшей в очень богатых гидротермальных жи льных месторождениях.
106
К счастью, крупные блоки менее подвержены большим из менениям содержаний, чем малые пробы. Действительно, фун даментальное допущение в методе скользящих взвешенных блоков состоит в том, что минимальный размер разработки так велик по сравнению с расстоянием, на котором наблюдается быстрое изменение содержаний, что дисперсия не изменяется при увеличении размера блоков. Поэтому наименьшие практи ческие единицы отработки приходится комбинировать в после довательном порядке для получения больших блоков. Если из менчивость в большинстве единиц оказывается много меньше, чем изменчивость практически наименьшего блока, то эти ма лые блоки будут иметь дисперсию, не превосходящую диспер сию больших комбинированных блоков. Теоретическая кривая зависимости дисперсии от объема выборки указана на рис. 5.61: она иллюстрирует предположение, что дисперсия устойчи ва при превышении минимального критического размера про бы.
Чтобы определить скользящее среднее для средних значе ний блоков, мы должны сначала определить веса, соответству ющие блокам. Необходимо задать также размещение самих блоков, но оно является более или менее произвольным. Пред положим, что мы решили воспользоваться планом скользяще го среднего, представленным на рис. 5.62. Мы хотим получить
оценку Y содержаний компонента в руде, которая будет добы та из блока 1 на основании разведочных проб, взятых в бло
ках 1—9. (Заметим, что Y — оценка содержания, полученная
• |
• |
|
• |
||
• |
||
со |
. |
|
|
||
1 * 1 |
|| |
|
|
• |
|
• |
• |
|
|
||
сп |
• |
|
• |
|
|
|
. |
• •
•8
•
•
••
• 2 *
•
••
3,1 •
••
•
•
* |
4 * |
• |
|
• |
• |
|
|
• |
6 . |
|
|
• |
|
• |
• |
СО • |
|
• |
* |
•
•
*7
••
Рис. 5.61. |
Теоретическое |
изменение |
Рис. 5.62. Схема скользящего средне |
дисперсии |
содержаний |
полезного |
го для оценки содержаний полезного |
компонента в зависимости от измене |
компонента в центре блока Y по сред |
||
ний объема пробы или разрабатывае |
ним для буровых скважин в блоках |
||
|
мого блока |
|
1 -9 |
107
для центра блока, a 55 — среднее |
значение разведочных проб |
в том же блоке.) Задав уравнение, |
с помощью которого вычис |
ляются оценки для Y, мы будем передвигать схему опробова ния на неизвестную область, получая при этом оценки содер жания в последовательности примыкающих блоков до тех пор, пока не покроем всю площадь.
Уравнение скользящего среднего определяется по значени ям содержаний рудного компонента, извлеченного из горной выработки в изучаемом регионе. Предположим, что наш план скользящего среднего нанесен на карту рудного тела, которое уже выработано. Используя полученные пробы и количествен ные анализы по каждому из блоков, можно вычислить средние значения для блоков, которым соответствуют наши переменные Уь У2...... Уэ. Записи добычи дают количество полезного ком понента, в действительности добытое из интересующего нас блока. Если обозначить его через Y, то можно связать содер жание в добываемой руде с количественными анализами раз
работки с помощью следующего линейного уравнения: |
* |
|
|
9 |
|
У — Ро + |
У« + г> |
(5.70) |
|
<=: |
|
которое, очевидно, является уравнением регрессии }' относи тельно Yu ...,Yj. Применяя эту схему последовательно ко мно гим блокам, получим множество наблюдений Y. Это даст воз можность решить (5.70) с помощью методов наименьших квад ратов, почти в точности совпадающих с теми, которые исполь зовались для построения поверхностей тренда.
Теперь у нас есть оценка Y содержания полезного компо нента в центральном блоке, которая основана на средних про бах, взятых из окружающих блоков. Прогнозирующее уравне ние содержит постоянный член н девять весовых коэффициен тов. Однако можно определить постоянную (50 как произведе ние новой постоянной на среднее по всем полученным пробам для всех блоков:
Ро — (Су или |
Зо= |
-Ы-. |
(5.71) |
|
Новая постоянная £5'о находится простым |
делением {10 на |
|||
обобщенное среднее по всем пробам |
(под термином «обобщен- |
|||
ное среднее» мы подразумеваем |
— |
1 |
9 _ |
Таким образом, |
}'= - |
|
^)У ,). |
||
|
|
|
i=i |
|
уравнение регрессии может быть записано так: |
|
|||
|
9 |
|
|
|
У = Р о ^ ' £ & У г+г- |
(5.72) |
|||
/=i |
|
|
|
10 8
Все коэффициенты уравнения регрессии, включая постоян ный член, можно теперь считать весовыми функциями. Прирав
нивая р0 к Р'0У, получим регрессию, не зависящую от какоголибо тренда, который имеется в данных, и уравнение будет применимо к другим площадям, даже несмотря на то, что среднее значение по этим новым площадям будет выше или ни же, чем в области, для которой уравнение было построено.
Теперь можно использовать уравнение регрессии в качестве скользящего среднего для неотработанной части месторожде ния. Поместив схему на карту разработки, нужно будет только взять пробы в каждом из девяти блоков. Используя значения количественных анализов, можно вычислить значения для каж дого блока, которые затем станут У-ами в (5.72) и будут ис
пользованы для оценки значения У. Затем эта схема применя ется последовательно к различным блокам в неразрабатывае мой части месторождения, давая оценки содержаний для раз ведки и подсчета запасов.
Успех применения метода зависит от двух условий. Во-пер вых, уравнение регрессии должно точно выражать содержание полезного компонента в уже освоенной части месторождения. Если качество аппроксимации с помощью линейной регрессион
ной модели плохое, то скользящее среднее У в применении к неразработанным частям месторождения будет малоэффектив ной оценкой для У. Однако благодаря устойчивости дисперсий в пределах больших блоков обыкновенно удается получить хо рошую аппроксимацию. Плохой подбор указывает на изменчи вость, масштаб которой сравним с размерами самих блоков. Второе важное условие состоит в том, что распределение зна чений в отработанной части месторождения очень сильно на поминает распределение в неотработанной части, хотя для оценок часто приходится использовать уравнения, построенные по данным совершенно другого рода. Однако оценка месторож дений — это динамический процесс, и техника оценки совер шенствуется по мере развития науки. Обычно же площадь, по которой строится прогнозное уравнение, выбирается от прогно зируемой настолько близко, насколько это возможно.
Как вы, вероятно, догадались, схемы взвешивания скользя щих блоков являются «изготовленными по заказу» рецептами для данного месторождения или даже для его части. Выбор схемы скользящего среднего определяется наличием сильного тренда значений, применяемой системой разработки месторож дения, а также многими другими факторами. По этой причине мы даже не пытаемся написать программу скользящего сред него общего назначения, хотя это относительно простая зада ча. Развитие этого метода и примеры его приложения к боль шим месторождениям даны Криге [46J.
109
КРАЙГИНГ
Понятие регионализованной переменной было введено б гл. 4 как естественная характеристика, промежуточная между полностью случайной и полностью детерминированной пере менными. Многие геологические поверхности, как существую щие, так и воображаемые, можно рассматривать как регионализованные переменные. Эти поверхности непрерывны от точки к точке и, следовательно, могут коррелироваться на корот ких расстояниях. Однако точки на нерегулярной поверхности, которые отстоят далеко друг от друга, являются статистически независимыми. Степень пространственной непрерывности ре гионализованной переменной может быть выражена варио граммой, как это было показано в гл. 4. Если измерения были сделаны в рассеянном множестве точек опробования и форма вариограммы известна, то можно оценить значение поверхности в любой точке, не принадлежащей выборке. Процедура оценки называется крайгингом в честь Д. Г. Крите, южноафриканско го горного инженера и пионера применения статистических методов при подсчете запасов.
Крайгинг можно использовать для построения карт в изо линиях, но, в отличие от обычных алгоритмов оконтуривания, он имеет статистически оптимальные свойства. Возможно, наи более важным является то, что этот метод обеспечивает изме рение ошибки или неопределенности поверхности изображае мой изолиниями. Крайгинг использует информацию из полувариограммы для нахождения оптимального множества весов, для оценки поверхности в точках, отличных от точек опробова ния. Так как полувариограмма является функцией расстояния, то веса изменяются в соответствии с географическим положе нием точек опробования.
Точечный крайгинг
Точечный крайгинг— простейшая форма крайгинга, в кото ром наблюдения состоят из измерений, взятых в безразмерных точках и оценки проводятся в других местах, которые сами также являются безразмерными точками. Точечный крайгинг используется, например, в построении карты в изолиниях для наблюдений, являющихся абсолютными отметками кровли формации, измеренными в ряде разведочных скважин. Постро ение структурной карты в изолиниях требует, чтобы оценки абсолютных отметок кровли формации были сделаны в близко расположенных точках на картируемой площади. Проделав это, можно провести изолинии через эти оценки так, как опи сано в предыдущем разделе.
ПО
Для упрощения задачи можно допустить, что картируемая переменная статистически стационарна или свободна от дрифта. Значение в точке, не принадлежащей выборке, может быть оценено как взвешенное среднее известных наблюдений, т. е. значение в точке р основано на ограниченном множестве близ лежащих контрольных точек:
Yp = lWiYi.
Следует ожидать, что оценка Yp будет отличаться от истинно го (но неизвестного) значения Yp на величину, которую можно назвать ошибкой оценки:
ер=(Ур-Ур). (5.73)
Если сумма весов, используемых в оценке, равна единице, то полученная оценка называется несмещенной при условии, что дрифта нет. Это значит, что для большого множества оценок средняя ошибка будет равна нулю, так как положительные и отрицательные отклонения взаимно компенсируют друг друга. Однако даже если средняя ошибка оценки оказывается нуле вой, оценки могут быть широко рассеянными относительно истинных значений. Это рассеяние можно охарактеризовать дисперсией ошибки:
^ = = ~ } ] ( У Р- У Р)2 |
(5-74) |
зли после извлечения квадратного корня стандартной ошибкой оценки:
st = V £ . |
(5.75) |
Как уже отмечалось в разделе по картированию в изоли ниях, интуитивно представляется правдоподобным, что ближай шие контрольные точки оказываются наиболее влияющими на щенку значения в точке поверхности, не являющейся точкой опробования, и что более удаленные контрольные точки ока зывают меньшее влияние. Мы также вправе ожидать, что ис пользуемые веса в процессе оценивания и ошибки оценок не которым образом должны быть связаны с полувариограммой
поверхности. В простом примере Кларк |
[13] показывает, что |
|||
это так. |
|
оценить |
значение |
У в точке |
Предположим, что требуется |
||||
р по трем близким точкам, используя в |
качестве |
оцениваемо- |
||
:о параметра взвешенное среднее трех известных значений: |
||||
Ур=и7,У,+ Ц72У2+И73Уз. |
|
|||
Веса подчинены условию, |
что |
сумма их |
равна |
единице, по |
этому в отсутствие тренда |
оценка является несмещенной. Пред |
111