Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

фик функции распределения характеризует вероятность выпа­ дения какой-либо заданной комбинации.

Эксперимент бросания монеты обладает четырьмя особен­ ностями:

1) в каждом испытании (или бросании) имеется только два возможных исхода (назовем их «успех» или «неудача»);

2)исход каждого испытания не зависит от предыдущих ис­

ходов;

3)вероятность успеха не меняется от испытания к испыта­

нию;

4)испытания повторяются заданное число раз. Распределение вероятностей, соответствующее указанному

нами типу эксперимента, называется биномиальным распреде­ лением.

В качестве примера геологических приложений можно упо­ мянуть предсказание вероятности успеха при бурении нефтя­ ных и газовых скважин. Четыре перечисленных выше характе­ ристики должны предполагаться справедливыми: допущения подобного рода кажутся наиболее приемлемыми при использо­ вании метода «дикой кошки» при разведке в сравнительно ма­ ло изученном бассейне. Следовательно, биномиальное распре­ деление часто используется для предсказания результатов бу­ рения на границе области или за пределами концессии.

В предположении о справедливости биномиального распре­ деления каждый результат применения метода «дикой кошки» может быть классифицирован либо как «открытие» («успех»)

либо как

пустая скважина («неудача»). Последовательные

ис­

пытания предполагаются независимыми, т. е. успех пли

не­

удача в

одной скважине

не влияет на результат опробования

в другой

скважине. (Это

допущение трудно обосновать

по

многим обстоятельствам,

так как открытие обычно влияет

на

результаты исследования следующих скважин. Появление по­ следовательности пустых скважин также приводит к изменению программы разведки.). Наконец, биномиальное распределение оказывается подходящим, если фиксированное число скважин будет пробурено в процессе разведки или в течение единичного периода времени (например, бюджетного цикла), для которого проведено прогнозирование.

За вероятность р открытия нефтяного или газового место­ рождения методом «дикой кошки» принимаются широко ис­ пользуемые в промышленности отношения, характеризующие успех бурения, которые были наблюдены в процессы бурения в аналогичных регионах, или аналогичные отношения, получен­ ные компаниями, делающими оценки, или же просто субъек­ тивные аналогичные характеристики. Для определения вероят­ ности р в биномиальной модели в разведочном бурении пре­ дусмотрены следующие этапы:

22

1) вероятность «успеха» бурения скважины обозначим че­ рез р,

2)вероятность «неудачи» бурения обозначим через 1—р,

3)вероятность того, что в результате последовательного бу­ рения п скважин методом «дикой кошки» все окажутся пусты­ ми, есть

Р= (1 — р)";

4)вероятность того, что п-я пробуренная скважина окажет­ ся продуктивной, причем п—1 предыдущих скважин окажутся

пустыми, равна

р= (1 — Р)п~1Р’>

5)вероятность появления одной продуктивной скважины в последовательности п скважин, пробуренных методом «дикой кошки», есть

Р= п( 1 — р)п-'р-у

так как продуктивной может оказаться любая из п скважин;

6)вероятность того, что будет пробурено п—г пустых сква­ жин, за которыми последует г продуктивных, есть

Р= (1 — р)п~грг\

7)однако п—г пустых скважин и г продуктивных скважин

могут быть

выбраны

способами, или, что эквивалентно,

ftt

различными

способами. Так, вероятность того, что

—---- :■— t

в программе бурения методом «дикой кошки» среди п скважин получим г продуктивных, равна

Р =

п\

(2.3)

(п — г)\г\ ■(1 ~ Р Т

Это — формула биномиального распределения, задающая веро­ ятность получения г успехов в последовательности п независи­ мых испытаний, вероятность успеха в каждом из которых рав­ на р.

Равенство (2.3) можно понимать как уравнение, которое может быть решено, т. е. может быть определена вероятность появления любой заданной комбинации успехов и неудач при любом заданном числе испытаний и заданной вероятности. Эти вероятности уже вычислены и затабулированы для многих ком­ бинаций п, г н р. Используя это уравнение или опубликован­ ные таблицы, такие, как, например, таблицы в книге Хальда [15], можно дать ответ на многие вопросы. Например, предпо­ ложим, что мы хотим определить вероятности, соответствую­ щие программе разведки в малоизученном бассейне, содержа­

23

щем пять скважин, причем отношение, характеризующее успех в этом регионе, равно примерно 10%. Какова вероятность того, что вся программа будет полностью безуспешной и мы не по­ лучим ни одной продуктивной скважины? Такой результат на­ зывается полным крахом по очевидным причинам, и биноми­ альное выражение содержит следующие члены

 

п = 5;

г = 0; р = 0,10;

 

Р-=

б').0,Ю°.| 1 —0,10)5 *= - iL . 1.0,905 =

1 ■1-0,591= о,.59.

5

’ 0/

5!0!

'

Вероятность того, что в результате разведки не будет получе­ но никаких продуктивных скважин, равна почти 60%.

Если только одна скважина окажется продуктивной, то ею могут окупаться все затраты в процессе разведки. Какова ве­ роятность того, что одна скважина окажется продуктивной в процессе разведки с пятью скважинами?

Р =

0,10’-(1 — 0, ЮГ = -^ --0,10 -0,904 = 5.0,10-0,656=0,328.

Используя либо биномиальное уравнение либо таблицу биномиального распределения, можно найти вероятности всех возможных исходов в программе бурения с пятью скважинами. Они представлены на рис. 2.3.

Рис. 2.3. Дискретное распределение, задающее вероятность успеха в програм­ ме бурения пяти скважин при условии, что вероятность успеха равна 10%

24

В других практических задачах, в которых основные допу­ щения отличны от указанных выше, могут быть использованы другие дискретные вероятностные распределения. Предполо­ жим, например, что геологоразведочная компания намеревает­ ся открыть два новых поля в мало изученном бассейне, пред­ полагаемом перспективным, и намеревается пробурить столько скважин, сколько потребуется для того, чтобы достичь этой доли. Мы можем исследовать вероятность того, что для этого потребуется 2,3,4..., до п разведочных скважин до того как бутет обнаружено две продуктивных скважины. Можно допус­ тить, что требуется наложить те же условия, которые были перечислены для биномиального распределения, исключая от­ носящееся к числу испытаний условие, которое теперь не явля­ ется фиксированным.

Вероятностное распределение, соответствующее такому эксперименту, называется отрицательным биномиальным, и его определение очень напоминает определение биномиального распределения. Как и в предыдущем примере, р есть вероят­ ность появления продуктивной скважины и г есть число «успе­ хов» или продуктивных скважин. Однако п, число испытаний, не задано. Вместо этого можно найти вероятность того, что бу­ дет пробурено х пустых скважин раньше, чем будет сделано г

открытий. Отрицательное биномиальное распределение

имеет

вид

 

 

(г+ * “

р)*р\

(2.4)

Заметим сходство между этим уравнением и уравнением (2.3); член r-i-x—1 появляется потому, что последняя из последо­ вательно пробуриваемых скважин, должна быть г-м успехом. Формулу (2.4) можно представить в следующем виде:

Р = 1 Т± £ ТТГГ(1- ^ Г'

(2.3)

(г — 1)1x1

 

Предполагая, что вероятность успеха, соответствующая дан­ ному региону, равна 10%, мы можем вычислить вероятность того, что геологоразведочная программа с двумя скважинами будет завершена открытием двух продуктивных скважин. Эта вероятность равна -

Р = ,(2+ 0 - .1)| .(} — о,Ю)о.О,102 =

(2 — 1)! О!

= _JL.O,90».0,102= 1 -1 -0,01 = 0,01.

но:

Вероятности, связанные с другими программами бурения, име­ ют различные числа скважин, и их можно найти аналогичным

25

образом. Вероятность того, что для достижения успеха в двух испытаниях требуется пять скважин, равна

Р = _(2 + э - 1 ) , 1 __ о 10)3.о 1Q2 = Л ,о 729.0 Q1 = 0,029.

Вычисленные вероятности низки потому, что они связаны с воз­ можностью появления двух продуктивных и в точности х пус­ тых скважин. Полезнее рассмотреть распределение вероятности того, что более х скважин должно быть пробурено до того как цель, состоящая в появлении г продуктивных скважин, бу­ дет достигнута. Эту вероятность можно получить, если сначала построить отрицательное биноминальное распределение в ку­

мулятивной форме, дающее вероятность

того, что

будет до­

стигнуто два успеха при бурении (х + r

или менее

скважин),

как это изображено на рис. 2.4. Вычитая далее каждую из этих, вероятностей из 1,0, получим желаемое распределение вероят­ ностей (рис. 2.5). Отрицательное биномиальное распределение будет рассмотрено снова в гл. 5, где с его помощью будет описана важная модель распределения точек в пространстве.

Имеются и другие дискретные распределения, которые при­ меняются в практических задачах, аналогичных тем, для опи­ сания которых используется биномиальное распределение. Та­ ково, например, распределение Пуассона, которое следует ис­ пользовать вместо биномиального, если р, вероятность успеха, очень мала. Пуассоновское распределение рассматривается в гл. 4, где оно применено к анализу редких случайных событий во времени (землетрясений или вулканических изменений), и в гл. 5, оно использовано для построения моделей объектов, случайно размещенных в пространстве. Геометрическое рас­ пределение, являющееся частным случаем отрицательного би­ номиального, используется в тех случаях, когда интерес на­ правлен на число испытаний, предшествующих первому успеху. Полиномиальное распределение — это обобщение биномиально­ го распределения на случай, когда имеется более двух взаимно исключающих исходов эксперимента. Эти вопросы широко представлены в большинстве книг по теории вероятностей, та­ ких, как книги Парзена или Аша [3].

Важным свойством всех упомянутых выше дискретных рас­ пределении является то, что вероятность успеха остается по­ стоянной в процессе испытаний. В статистике рассматриваются простые эксперименты, называемые выборкой с возвращением, в которых это условие строго выполнено. Наиболее типичный эксперимент такого рода можно провести с урной, заполненной красными и белыми шарами; если наугад выбирается один шар, то вероятность того, что он будет красным, равна отноше­ нию числа таких шаров в урне к общему числу шаров. Если затем этот шар возвращается в урну, то процентное отноше-

26

Рис. 2.4. Дискретное распределение, задающее кумулятивную вероятность того, что будут наблюдаться два успеха во время бурения (или до него) дан­ ной скважины, если вероятность успеха равна 10%

Ч исло скваж ин

Рис. 2.5. Дискретное распределение, дающее вероятность того, что будет про­ бурено больше заданного числа скважин, для того, чтобы получить два успе­ ха, при условии, что вероятность успеха равна 10%

ние двух цветов в урне остается неизменным, и вероятность появления красного шара при повторном выборе остается не­ изменной. Эта вероятность также остается приблизительно по­ стоянной, если имеется очень большое число шаров в урне, да­

же

в том

случае,

если делается выбор без возвращения, так

как

выбор

шара

приводит к

бесконечно

малому изменению

пропорций

среди

остающихся

шаров. Это

последнее условие

обычно предполагается выполненным при геологических поис­ ках, когда естественно использовать дискретные распределе­ ния. В нашем примере «урна» — это геологический бассейн, в котором проводятся работы, а красным и белым шарам со­ ответствуют неоткрытые залежи и пустые площади. До тех

27

пор, пока число не подвергнутых бурению

участков велико,

а число оправдавших себя в результате

бурения прогнозов

(шаров, извлеченных из урны) мало, предположение о посто­ янстве вероятности открытия кажется оправданным. Однаю> если выборочный эксперимент осуществляется с малым исход­ ным числом раскрашенных шаров в урне, и они выбираются из урны без возвращения, то очевидно, что вероятность изменяет­ ся после каждого выбора. Такой эксперимент, называемый вы­ бором без возвращения, описывается дискретным гипергеомет­ рическим распределением. Геологические задачи, в которых целесообразно его использование, весьма специфичны, и Л\ак Грей [25] приводит пример, связанный с геофизическими мето­ дами разведки нефтяных месторождений.

В некоторых случаях можно определить размер совокупно­ сти, в пределах которой ведется поиск. Предположим, что кон­ цессия в открытом море обнаружила десять явных аномалий, причиной которых являются, возможно, перемещения соли на глубине. Из опыта предыдущих исследований следует, что око­ ло 40% таких сейсмических аномалий указывают на наличие продуктивных структур. При реализации программы разведоч­ ных работ в силу ограниченности средств нет возможности осу­ ществить бурение в местах проявления аномалий. Для оценки вероятности того, что будет обнаружено заранее заданное чис­ ло залежей, если только некоторые из предсказанных перспек­ тивных площадей будут разбурены, может быть использована гипергеометрическое распределение.

Биномиальное распределение для решения этой задачи не­ пригодно, так как вероятность обнаружения изменяется при каждом случайном испытании. Если имеется четыре залежи, каждая из которых входит в число десяти площадей, предска­ занных сейсмическими методами, то открытие одной из них уменьшает шансы открытия другой, так как остается меньше объектов, которые должны быть обнаружены. Наоборот, обна­ ружение пустой скважины на основе сейсмических данных уве­ личивает вероятность того, что оставшиеся непроверенными структуры будут продуктивными, потому что одна непродуктив­ ная структура уже исключена из совокупности.

Вычисление гипергеометрическои вероятности состоит про­

сто в нахождении

всех возможных комбинаций

продуктивных

и пустых структур

внутри совокупности и затем

в перечисле­

нии тех комбинаций, которые дают требуемое число обнару­ жений. Вероятность осуществления х обнаружений при буре­ нии п скважин, если делается выборка из совокупности" N элементов, 5 из которых, возможно, содержат залежь, равна

(2.6}

28

Это есть произведение числа комбинаций из числа залежей пс числу обнаружений на число комбинаций из пустых аномалий по числу пустых скважин, деленное на число комбинаций из всех предсказанных объектов по общему числу скважин в про­

грамме бурения.

Гииергеометрическое вероятностное распределение может быть применено к нашей концессии в открытом море, которая содержит десять сейсмических аномалий, четыре из которых, возможно, содержат залежи. К сожалению, мы заранее не зна­ ем, бурение каких из четырех аномалий даст положительный результат. Если в текущем сезоне бюджетные ограничения по­ зволяют осуществить бурение только трех скважин, мы можем определить вероятности, связанные с каждым из возможных исходов.

Какова вероятность того, что программа бурения потерпит полный провал, т. е. не будет получено ни одной продуктивной скважины среди трех пробуренных?

= 0,167.

120

Вероятность полного краха равна примерно 17%.

Какова вероятность того, что будет сделано одно обнару­ жение?

Р =

Вероятность того, что будет найдена одна продуктивная скважина, равна 50%.

Можно построить гистограмму, на которой будут представ­ лены все вероятности, связанные со всеми возможными исхо­ дами в этой разведочной задаче (рис. 2.6). Заметим, что ве­ роятность успеха равна (1,00—0,17), или 83%.

Предыдущий пример относился к случаю, когда имеется только два возможных исхода: пустая скважина или обнару­ жение нефти. Если нефть найдена, скважина не может быть пустой, и обратно. События, в которых частота появления од­ ного исхода позволяет предсказать частоту появления другого исхода, называются взаимно исключающими друг друга. Веро­ ятность того, что произойдет одно или другое событие, есть сумма вероятностей появления каждого нз них; т. е. р (обна­ ружения или пустой скважины) —р (обнаружения) (пустой скважины). Это — правило сложения вероятностей.

29

2.6. Дискретное распределение, задаювероятность п успехов в трех скважи-

из десяти, если четыре из десяти пере­ секли нефтяную залежь

События не обязательно являются взаимно исключающими. Например, при разведочном бурении на нефть и газ появление залежи с пористым песчаником можно интерпретировать как антиклинальную структуру, исходя из сейсмических данные. Эти два исхода, пористый песчаник и бурение по антиклинали, не являются взаимно исключающими друг друга, так как мы встречаем их одновременно. Поскольку наличие песчаника уп­ равляется факторами, которые действовали во время образо­ вания месторождения, и поскольку появление антиклинальной складки предполагается связанным с тектоническими условия­ ми в более поздний период, эти два исхода являются несвязан­ ными или независимыми. Если два события не являются иск­ лючающими, но являются независимыми, то совместная веро­ ятность того, что они появятся одновременно, есть произведе­

ние вероятностей их появления.

То есть р (песчаника или

ан­

тиклинали) = р (песчаника) Хр

(антиклинали). Это — правило

умножения вероятностей.

 

так

Два события могут быть связаны некоторым образом,

что исход одного отчасти зависит от исхода другого. Совмест­ ная вероятность таких событий называется условной. Такие события очень важны в геологии, так как одно из событий мпжет быть прямо доступно наблюдению, а другое при этом может быть скрыто. Если они обусловлены друг другом, то частота наблюдаемого события говорит нам кое-что о вероят­ ном состоянии скрытого объекта. Например, извержение магмы из камеры вулкана, аналогичного вулкану Святой Елены в Вашингтоне, по общему мнению, приводит к гармоническим колебаниям, напоминающим землетрясение. Мы не можем пря­ мо наблюдать активность магматической камеры, однако мы можем наблюдать записи сейсмической активности, связанной с вулканом. Если между этими явлениями существует взаимная

.30

обусловленность, то появление гармонических колебаний мо­ жет помочь предсказать извержение. Если р колебаний) — вероятность того, что появятся гармонические колебания, и р

(извержения)— вероятность

последующего

вулканического

извержения, то р (колебаний

или извержения)=/=р (колеба­

ний) Хр (извержения), если два события имеют взаимную об­ условленность.

Условная вероятность того, что произойдет извержение, за­ данная тем, что гармонические колебания были записаны, обозначается р (извержения/колебания). В этом примере ус­ ловная вероятность извержения больше, чем безусловная веро­ ятность или р (извержения), которая есть просто вероятность того, что произойдет извержение без какой-либо дополнитель­ ной информации о других событиях. Другие условные вероят­ ности могут быть меньше, чем соответствующие безусловные вероятности (вероятность нахождения некоторого ископаемого на площади вулканического происхождения значительно ниже, чем безусловная вероятность нахождения ископаемого). Оче­ видно, геологи используют условные вероятности на всех ста­ диях проведения своих работ, делая это сознательно или нет.

Связь между условными и безусловными вероятностями можно выразить теоремой, названной в честь английского свя­ щенника, жившего в XVIII в. и открывшего ее, теоремой Байе­ са. Он исследовал изменение вероятности по мере увеличения

количества информации.

Основное

уравнение

Байеса

имеет

вид

 

 

 

 

Р(А,В) = Р{В\А)Р(А).

 

(2.7)

Оно устанавливает, что

совместная

вероятность

Р (А, В)

того,

что оба события А и В произойдут, равна вероятности Р (В/А) появления события В при условии, что событие А уже произо­ шло, умноженной на вероятность Р (Л) появления события. Р(В/А) называется условной вероятностью, так как выражает вероятность того, что произошло событие В, при условии, что событие А уже произошло. Если события А и В связаны (или зависимы), то тот факт, что событие А уже произошло, гово­ рит нам нечто о правдоподобности появления события В.

Наоборот, также справедливо равенство

Р(А,В) = Р (А\В)Р (В).

Приравнивая правые части, получаем

Р(В\А)Р(А) = Р(А\В)Р(В),

что можно переписать в виде

(2.8)

Р (А)

•31

Соседние файлы в папке книги