книги / Методы принятия технических решений
..pdf62 |
Глава 6 |
6.3. Энтропия независимого параметра
Гензель [20] предложил применять шенноновскую энтропию (6.13), рассматриваемую как мера неопределенности сигнала, передаваемого случайным источником, и для измерения неоп ределенности.
Если параметр xi может принимать в общей сложности щ различных значений, каждое из которых имеет соответствую щую вероятность появления qij, /= 1, ..., щ, то тогда мерой его
неопределенности будет энтропия
|
ni |
qij In qij. |
(6.9) |
|
Ht= — £ |
||
|
/~i |
|
|
В связи с тем, что для |
всех / =1, |
..., tij справедливо неравенство |
|
Hi всегда |
является |
неотрицательной |
величиной. |
В особом случае, когда одно из значений хц* имеет вероятность
*ч
появления <7п> = 1, величина Hi = 0, так как из 2 ^ = 1 вытекает,
/-1
что для всех qij = 0, т. е. xi принимает только одно значе ние хц, и тем самым неопределенности не существует. С другой
стороны, Hi |
будет иметь максимальную величину, когда все |
tii значений |
параметра Xi равновероятны: <7/ / = 1//г/, где /= 1, ... |
..., tii. В этом случае ни одно из возможных значений параметра не имеет приоритета по отношению к другим, и, таким образом, речь идет о полной неопределенности.
Рис. 6.2 отражает график изменения величины энтропии двух возможных значений независимого параметра в зависимо сти от вероятностей появления обоих этих значений. Непосред ственный перенос формулы (6.9) на случай бесконечно боль шого числа возможных значений параметра невозможен, так как при этом величина Hi стремится к бесконечности, посколь ку неопределенность в этом случае и в самом деле неограни ченно возрастает. Это же явление наблюдается при дискрети зации какой-либо непрерывной функции плотности распределе
ния |
вероятностей, |
когда |
непрерывное |
распределение |
приближенно заменяется дискретным, а для |
последнего п^ |
|||
формуле (6.9) вычисляется |
энтропия, которая |
затем, путем |
последовательного измельчения интервалов дискретности, по
стоянно уточняется. При использовании |
непрерывного |
закона |
|||||
распределения с бесконечной областью |
значений |
случайной |
|||||
величины, |
например, нормального |
распределения |
в |
области |
|||
(— оо, + оо) |
или |
распределения по |
экспоненциальному |
закону |
|||
в области |
(0, |
о о ), |
перед дискретизацией |
данная область огра |
ничивается путем отсечения на ее краях бесконечных интерва лов значений с очень малыми вероятностями реализации.
Количественные характеристики ситуации принятия решений |
6 |
$ |
Таким образом, даже и в таких случаях можно иметь дело с конечной областью значений случайной величины.
Если, например, для параметра xi с конечной областью изменения значений [min*y, шахдсу] эта область разбивается
//
на tii интервалов длиною Дi и каждому /-му интервалу, в соответствии с изменением на нем плотности вероятностей*
Рис. 6.2. Энтропия двух состояний одного параметра.
приписывается своя вероятность реализации <7у значений пара-
ч
метра, так что 2<7у=1, то справедливо выражение
п/Д/=тахдсу — minx//. |
(6.10V |
I J
Согласно (6.9) после такой дискретизации можно определить соответствующую величину энтропии:
Ч
Ht (At) = — Д qit In qij.
На рис. 6.3 показаны графики изменения энтропии H(Ai) нормально распределенного дискретизированного параметра в зависимости от величины интервала дискретизации Д/ при различных значениях среднеквадратического отклонения а. Выбор ширины интервала Дг связан с требованиями к процеду ре дискретизации непрерывно распределенного независимого параметра xt и будет обсужден в гл. 9.
Для приближенного вычисления энтропии непрерывно рас пределенного параметра xi по заданной функции плотноста
64 |
Глава 6 |
Рис. 6.3. Зависимость энтропии нормально распределенного параметра от вели чины интервала и среднеквадратического отклонения рО].
вероятностей ft(x) определим сначала, используя значения параметра хц на каждом соответствующем /-м интервале, веро ятность реализации каждого из этих значений:
Qti—fi{xii)Ait / = 1, .... т. |
(6.11) |
Тогда, подставляя это выражение в формулу (6.9), получим
Я, (А,) = - 2 ft (х„) Д/ In (ft (х„) ДО,
ai
а с учетом того, что 2 ^ = 1, выражение для энтропии примет
вид
Я, (А,) - - 2 |
U(х„ ) In (ft (х„)) А, - In А;. |
(6.12) |
|
При Пг*-оо, что, согласно |
(6.10), |
равнозначно Аг^-0, |
первый |
член предыдущего выражения стремится к интегралу |
|
||
— S ft(x)\nft(x)dx. |
|
||
Полагая, наконец, |
|
|
|
Hi (ДО: = —+f ft (x) In ft (x) dx — In Ai, |
(6.13) |
||
получим |
|
|
|
Hi (At)/Hi (At) = 1 |
при At-*•(). |
|
Таким образом, для достаточно малых значений At функцию
Количественные характеристики ситуации принятия решений |
65 |
Hi можно считать аппроксимацией выражения для ///(А*) |
и тем |
самым рассматривать ее в качестве выражения для энтропии дискретизированного распределения с непрерывной функцией плотности вероятностей fi(x).
Первый член правой части выражения (6.13) отражает влияние на величину энтропии со стороны вероятностного рас пределения, заданного функцией его плотности fi(x)\ мы будем называть его главной *составляющей энтропии\ в инженерной практике, и прежде всего в электротехнике, ее часто называют
дифференциальной энтропией. Второй член — In А/, не завися щий от типа вероятностного распределения, обусловливает неограниченное возрастание энтропии при неограниченном из мельчении интервала дискретности.
В табл. 6.2 приведены приближенные выражения для неко торых часто используемых функций распределения, а также ошибки приближения в зависимости от числа интервалов.
Если имеющаяся информация о рассматриваемом вероят ностном распределении недостаточна для его оценки, то, сле
дуя принципу |
гарантированности результата, содержащемуся |
в минимаксном |
критерии, с учетом установленных на основе |
этой информации дополнительных условий {NB) можно опре делить максимально возможное значение энтропии. Таким об разом, при непрерывном законе распределения из системы
+оо
— $ ft(x)\nfi(x)dx-*-max
*•30
(б.Н)
и Т h(x)dx=lA(NB)
—оо
определяется вид закона распределения и соответствующая ему главная составляющая энтропии.
В табл. 6.3 для трех случаев, для которых в качестве допол нительных условий заданы области распределения параметров (а в третьем случае также среднее значение и среднеквадра тическое отклонение), представлены соответствующие этим законам распределения выражения для главной составляющей максимальной энтропии.
Энтропию параметров в технических задачах, а также зна чимость В этих параметров можно определять описанным мето* дом в случаях, когда параметры представлены только в виде дискретного либо только непрерывного распределения. Так как в общем случае величина интервалов дискретизации задается произвольно (как правило, исходя из ограничений на вычисли тельные затраты), величины энтропий, рассчитанные таким методом, нельзя без дополнительных оценок считать равными
Б—152
|
Т аблица 6.2, Ошибки приближения (6.13) |
для некоторых функций |
распределения |
|
|
||||
|
|
|
|
Ошибка Я(Д)—Я(Д), % |
|
|
|
||
|
Нормальное распределение |
|
|
Распределение Вейбулла |
|
|
|||
|
Функция плотности |
|
|
Функция |
плотности распределения |
|
|
||
|
распределения |
|
|
|
|
||||
Число |
fH(*) **еЦ2яо~ (х—ц)2/2о2 |
|
|
fB(x)-r,66x6~ l * Л )6 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
валов |
|
|
|
|
|
|
|
|
|
п |
Аппроксимация |
|
|
|
Аппроксимация |
|
|
|
|
|
|
|
|
|
|
|
|||
|
Ян*1п у2ле<т/Д |
|
|
Я в=1п(е/т]б бД) + (б—1)/6 |
|
|
|||
|
Параметры распределения |
|
|
Параметры распределения |
|
|
|||
|
ог=1, д = 0 |
пв—2 |
пв=1 |
Лв= 0,5 |
Л6—1 |
Пб- 1 |
Лб=1 |
Т)в- 1 |
|
|
Область |
распределения |
6 -1 .5 |
6 —1.в |
6 = 1*5 |
6 -0 ,5 |
6 - г* |
6=J2 |
6 - 3 |
|
Г -5...+51 |
||||||||
2 |
— 127,5 |
— 1,3*10» |
—2687 |
|
— 118 |
1615 |
|
|
|
3 |
— 43,7 |
— |
228 |
— |
— |
||||
4 |
— 33,9 |
— 18-103 |
—236 |
— |
— 68,3 |
72,9 |
— |
— |
|
5 |
— |
15,6 |
— 1684 |
—58,6 |
—250 |
—44,8 |
33,0 |
207 |
— |
6 |
— 10,4 |
—359,5 |
—25,5 |
—76,6 |
- 3 1 ,4 |
18,1 |
63,7 |
509 |
|
8 |
- |
4,9 |
—56,2 |
— 10,5 |
—20,7 |
— 17,2 |
7,4 |
29,0 |
84,6 |
10 |
- |
2,7 |
—21,3 |
—6,3 |
— 10,7 |
— 10,0 |
3,9 |
18,6 |
56,7 |
20 |
— |
0,5 |
- 3 , 9 |
- 1 , 6 |
- 2 , 5 |
- 1 , 8 |
0,6 |
4,0 |
9,1 |
50 |
— |
0,005 |
— 0,7 |
- 0 , 3 |
- 0 , 5 |
- 0 , 9 |
0,04 |
0,5 |
0,9 |
* Экспоненциальное распределение
Таблица 6.3. Максимальная энтропия при заданных |
законах плотностей распределения вероятностей |
|||
|
и дополнительных условиях |
|
||
Дополнительные условия |
Закон плотности распределения |
Главная составляющая |
График плотности распределения |
|
энтропии |
||||
|
|
|
||
|
|
|
f(X> |
|
х с х с х |
|
Н =1п(х— х) |
|
|
|
|
|
Ys |
0<Jt<oo, х |
|
1 |
|
|
fix) = |
-x?z-e-x/x |
|
tf = 1+ ln X |
|
|
|
|||
_ |
f(x) - |
! - ( X - X ) * |
|
|
—oo<x<+oo, X, (a) |
— = ■ e |
2<j2 |
# = 1пУ2яео2 |
|
|
' v ’ |
oV2n |
|
|
|
|
X |
6 8 Глава 6
энтропии, соответствующей непрерывному распределению. Если для какого-либо непрерывного распределения задано по край ней мере одно эквидистантное дискретное распределение, то величину интервала дискретности дискретного параметра мож но принять за опорную при дальнейшем расчете энтропий дру гих непрерывных параметров.
Если в условиях задачи даны различные дискретные пара метры наряду с непрерывными, то общего подхода для всех конкретных случаев просто не существует. Если же удается перевести дискретное распределение в непрерывное, то в этом случае можно применить знакомый нам метод разбиения обла сти распределения параметра на щ интервалов величиной Аг.
По величине значимости В определяется число интервалов п1 дискретизации непрерывного параметра, что подробнее будет описано в разд. 9.5. Однако точность необходимых приближений не следует задавать слишком высокой, так как обычно число интервалов разбиения щ не оказывает сильного влияния на результат, а наша цель состоит в рассмотрении распределения одного значимого параметра из ограниченного вычислительны ми затратами числа N оцениваемых параметров внешних усло вий среди L неизвестных параметров.
6.4.Доверительные факторы
Воснове излагаемых ниже рассуждений о ситуациях нринятия решения, связанных с определенной степенью риска, лежит предположение о том, что решение, соответствующее наимень шему значению min;tj из соответствующей выборки или ряда
допустимых значений независимого параметра х и х2, ...» хп> приводит к самым неблагоприятным последствиям. Кроме того, предполагается, что данные значения параметра являются реа лизацией случайного процесса с соответствующими относитель ными частотами распределения Ль h2, ..., Лп, которые, в свою очередь, сходятся к (теоретическим) вероятностям ри р2, .... рп этих значений параметра. Средняя величина заданного ряда значений независимого параметра должна существенно отли чаться от наименьшего из его значений minx-,-, что характери
зуется так называемым доверительным фактором, объективно оцениваемым заранее задаваемой величиной вероятности а принятия ошибочного решения. Здесь следует различать три принципиально разных случая:
1. На основании заранее известной выборки значений пара метра или по результатам проведения v экспериментов по опре делению его значений оценивается относительная величина
Количественные характеристики ситуации принятия решений |
09 |
отклонения теоретического среднего значения параметра от его наименьшего значения; это осуществляется с помощью эмпири ческого доверительного фактора Vv(cc).
2.Если вероятности ри р2, •••> Рп известны, то оценивается относительная величина отклонения среднего значения из вы борки, полученной в результате проведения серии из а> экспери ментов, от наименьшего значения параметра; при этом исполь зуется прогностический доверительный фактор V9 (а).
3.Относительная величина отклонения среднего значения параметра от его наименьшего значения оценивается для пред
стоящего проведения серии из w экспериментов по результа там заранее известной выборки, состоящей из v эксперимен тов; это осуществляется с помощью эмпирико-прогностического доверительного фактора Vvw(a).
Последний из названных подходов охватывает задачи обе их упомянутых выше категорий и к тому же лучше других соот ветствует задачам, встречающимся на практике. Далее будет дан анализ характеристик и взаимосвязи указанных довери тельных факторов. Будем также считать, что значения парамет ра расположены в ряде по мере их возрастания, т. е. х\<х2<
<...<*„, так что minx,=Xi.
/
6.4.1. Эмпирический доверительный фактор
Эмпирический доверительный фактор, определяемый по результатам выборки, состоящей из v экспериментов, с учетом вероятности а принятия ошибочного решения задается соотно шением
V0 (a) = [M „(a)-JC 1]/(Alo- x |
1). |
(6.15) |
Здесь х\ — минимальное значение параметра |
из |
ряда х\, х2, ... |
П |
|
|
..., х,„ а М„= S ft/Х/ — эмпирическое среднее значение параметра,
где hj — относительная частота реализации значения параметра
П
X), поэтому Е Лj= 1.
П
Величина Mv(a) =jS?iv,j(a)xj представляет собой наиболее
неблагоприятное, т. е. наименьшее из реально возможных
среднее значение параметра, которое вычисляется на основании |
|
частотного распределения выборки параметров |
(Ль Л2, ..., Л„) |
и вероятности принятия ошибочного решения а, |
причем теоре |
тическое распределение вероятностей |
(pt, р2, |
.... р п ) неизвест |
|
но. Коэффициенты |
а) задаются исходя из индивидуального |
||
оценивания значений вероятности pj |
с учетом |
допуска а на ее |
70 Глава 6
ошибочное оценивание. При этом, конечно, справедливы выра жения
_ |
п |
^ |
|
0<hvj (а) <1 |
и |
At-,/(а) = 1 . |
|
Необходимо учитывать, |
что наиболее |
неблагоприятным |
|
является тот случай, когда |
малым |
значениям |
параметра из |
ряда х\, *2. •••, хп соответствуют наибольшие вероятности в рам ках указанного выше индивидуального оценивания. Обозначив через Hj такую случайную величину, реализацией которой слу жит относительная частота А/, получим величину Ai = h,v, под чиняющуюся биномиальному закону распределения В (А/, v, pj) с параметрами v и р3-. Согласно этому закону из уравнения
В(Ai, v, |
pi) = l—е = а, где ki = vhi, |
получим сначала |
для веро |
|||||
ятности |
pi индивидуальную |
оценку |
|
полуинтервала |
[0 , р\] |
с |
||
учетом |
допуска на ошибку |
оценивания |
е = 1—ос. |
Значение |
р\ |
|||
можно взять из таблицы биномиального |
закона |
распределения |
||||||
(см., например, [2 1]). Кроме того, справедливо выражение |
|
|||||||
Р1 |
(fel-(-l)Fm l , m2» ^ |
где |
wii=2(Ai + l), |
(6.16) |
||||
= |
m2 = 2(v—Ai). |
|||||||
|
V — A i-f-(A i+ l)F m l, m2", |
8 |
|
|
|
Квантиль Fmi,m2 >в биномиального закона распределения опре деляется из статистических таблиц (см., например, [2 1 ]).
Двусторонняя индивидуальная оценка интервала [р;, р,\, j = 2 , ..., п, для вероятности р/ также определяется из таблицы (см. [2 1]).
С целью упрощения методики получения доверительных оценок биномиальный закон распределения можно заменить асимптотически приближающим его нормальным законом рас
пределения, однако для |
этого необходимо иметь достаточно |
|||||||
большой объем v выборки реализаций параметра. |
|
|||||||
В этом случае |
|
|
|
|
|
|
||
|
Р1 |
1 |
(* i+ ^ - + г 1_а у |
|
+ |
, |
||
|
v+zzi-a |
|
||||||
|
|
|
|
|
|
|
|
|
Ph Pi |
|
1 |
(k, + |
Zl_a/2 |
у |
M p-* /) |
..+ i!i=aa- |
|
|
V+Z\~an |
|||||||
|
|
|
|
|
|
|
(6.17) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/ = 2 ........n. |
|
|
|
|
Здесь |
kj — vhj, где |
/= 1, |
2, ..., n, a |
zi_a |
и zi_ a/2 |
представляют |
||
собой |
квантили порядка, соответственно, 1 —а |
и 1 —a / 2 |
стан |
дартного нормального распределения. Величины этих квантилей указываются в таблицах, приводимых в широко распространен-
Количественные характеристики ситуации принятия решений |
71 |
ной литературе по теории вероятностей и статистике, например* в работе [21]. В последнем из выражений (6.17) знак «минус»
справедлив при вычислении pj, а знак «плюс» — при вычисле нии pj.
Весовые коэффициенты %vj(a), /= 1 , ..., п, определим индук тивно:
|
|
|
hv,i(a): = pi, |
|
|
|||
|
- |
|
г |
/ - 1 |
~ |
|
|
|
|
Л»,/ (a) : = min [max |0 , |
1— 13 |
А„,<(а) |
|
|
|||
|
|
|
/= 2 , |
п — 1 |
|
|
||
|
hv,n(а): = шах |
|
|
|
|
|
||
При |
этом, естественно, |
выполняются условия |
0^% v,j( a ) ^ l |
|||||
п |
|
также |
определено |
значение |
п |
|
||
иД Я в|/(а) = 1 , а |
v(ot) 2 |
|
||||||
При |
стремлении |
объема выборки |
к |
|
/= i |
при |
||
бесконечности, т. е. |
||||||||
у->оо, согласно закону |
больших |
чисел (с вероятностью |
1 )* |
асимптотически выполняются следующие соотношения: р\-+рь
Р/, 'pr+РГ, K i {a)~+Pi\ hj-+pj\ отсюда следует, что при v-*<x>
У«(а)-*1 »т. е. при неограниченном возрастании объема выборки (o-^оо) эмпирический доверительный фактор стремится к еди нице. Очевидно, что сохраняется условие
ОсУ® (ос) ^ 1 •
Из приведенных выше формул (6.16) и (6.17) следует, что с уменьшением объема выборки до нуля эмпирический довери тельный фактор также стремится к нулю, что математически
записывается так: lim V ^(a)=0 . v-*0
С учетом |
равенств |
п |
п |
выражение (6.15) |
2Л;=1 и E%v>j(a) = l |
||||
|
|
/ = 1 |
/ = 1 |
|
можно представить в виде |
|
|
||
|
|
п |
^ |
|
|
|
2 |
hv,i(a)(xi — xi) |
|
|
Vv («) |
= £=!-----------------. |
(6.19) |
|
|
|
2 |
hj(xi — x,) |
|
Для частного |
случая |
п = 2 выражение (6.19) |
приобретает про |
|
стой вид |
|
|
|
|
Vv(a)=hv,2(a)Jh2= ( l -p j)/A 2= ( l — р,)/(1 - Л ,)
(6.20)