Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

102 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

априорная информация о распознаваемых образах, которая обычно является основой для получения оценок. Поэтому мы применяем для получения оценок стохастического распознавания закон больших чисел и центральную предельную теорему.

Вернемся к формулам, приведенным в начале параграфе, и к призна­ кам распознавания в виде интегралов от степеней хорд, рассмотренных в § 2.2. Закон больших чисел утверждает, что мы можем оценить эти интегралы с помощью произвольной выборки. Центральная предельная теорема позволяет определить вероятность нахождения оцениваемых величин в заданном диапазоне. На основании вышеизложенного будем считать, что плотность вероятности процесса бросания случайных линий G определяется выражением dG/Ьф или (dp/\de)/L& . Тогда математическое ожидание п-й степени хорд дп, пересекающих некото­ рое множество F, заключенное внутри области Ф с границей Ьф, будет

dG

Мдп

F

где интеграл берется по F. Это означает, что интегрирование прово­ дится по области в пространстве параметров линий (р,0), соответству­ ющей линиям G, пересекающим F. Ограничение интегрирования этой областью позволяет исключить из плотности вероятности под интегра­ лом сомножитель — функцию, рассмотренную в начале параграфе, которая отражала факт пересечения линий G и множества Ф.

Рассмотрим сначала применение закона больших чисел. Мы про­ извольно выбираем случайную последовательность линий в соответ­ ствии с плотностью вероятности dG/Ьф. Затем определяем хорду <&, высекаемую множеством F, на каждой случайной линии б?*, имеющей

N

общие точки с F. Далее подсчитываем сумму Y/ 9?> если происходит

г = 1

оценивание признака распознавания — интеграла 1п . Согласно закону больших чисел (не усиленному)

Р

 

О

(N —>оо, s > 0),

 

ф

 

 

где Мд? = | gndGj

j dG. Поскольку J dG

Ь ф , мы видим, что пре-

Ф

ф

ф

 

 

 

дел (по вероятности)

 

 

 

 

Ит Ьф

дп dG.

 

N —>-оо w

 

 

N

Следовательно, сумма 9? представляет для нас прямой интерес.

Далее обратимся к центральной предельной теореме. Мы находим, что

4.2. Оценка точности определения признаков

103

распределение произвольных значений сумм N независимых, одина­ ково распределенных переменных с конечным средним значением и дисперсией приближается к нормальному распределению при N —>оо:

N

' Е 9? - NMg?

Ф03) ( W - оо),

 

р<

у / Я Щ

< р

 

 

 

 

 

где

 

 

 

 

 

 

= 27Г

dy;

 

 

 

 

 

 

 

J д2п dG

- \ д п dGI 2

 

 

Dд? =

ф______

ф ________

 

 

 

\d G

jd G

 

 

 

Ф

- ф

 

или

 

 

 

 

Dff?

1

g2nd G - {

1

(4.6)

Ьф

gndG

 

 

Ьф

 

Эта формула показывает, что дисперсия д? возрастает при умень­ шении периметра Ь ру если Ьф остается постоянным; следовательно, в этом случае возрастает и среднеквадратическое отклонение. Этот факт представляется ясным и из интуитивных соображений — при уменьшении размера изображения F на сетчатке Ф увеличивается ошибка измерения признаков изображений объектов и ухудшается надежность распознавания.

Выражение для относительной ошибки мы можем найти, применив центральную предельную теорему [8, 119]. Получим следующую фор­ мулу для определения относительной ошибки:

N

 

 

Т г £ д ? ~ М д ?

 

£г =

М

д?

 

 

Из центральной предельной теоремы при (3 > О

N

 

 

 

у Е 9? -

М д?

fog? }

 

Р

 

Ф {(3)-Ф {-(3) (N —» оо).

 

 

М до

Мд? s/N J

104 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

Пусть е / 2 = 1 —Ф(/?). Если K(s/2)=f3, можно убедиться*1, что имеет место неравенство

К(е/2)адУ'

rs/N M g^

свероятностью, очень близкой к (1 —е) для достаточно большого числа N . Выразим эту относительную ошибку ег измерения признаков через интегралы от степеней хорд 1п . Для этого подставим в предыду­ щую формулу значения ад” и M gf, определенные ранее, в результате получим

L Ф

Из этого уравнения для относительной ошибки мы можем сделать вывод: увеличение длины Ьф, т. е. периметра сетчатки, увеличивает верхнюю границу относительной ошибки. При увеличении допустимой ошибки е уменьшается верхняя граница относительной ошибки ег, как и при увеличении объема выборки N, который соответствует числу случайных бросаний линии или числу шагов сканирующей систе­ мы распознающей системы, рассмотренной в § 2.2. С математической точки зрения N — это число случайных отсчетов для оценивания интеграла 1п .

Прямое применение центральной предельной теоремы показывает, что суммы, используемые для оценки таких интегралов, служащих признаками распознавания, нормально распределены, а их среднее

1 К [г) — абсцисса нормальной кривой ошибки, такой, что площадь под этой кривой вправо от абсциссы равна е, т. е.

1

е-<*2>/2^ .

\/27Г

К( е )

Сучетом понятий, определяемых как

erf(х) =

е~и dU,

 

V5F

К(е) может быть выражено с помощью erf(K(e)yJ2) = 1—2е. Например К {0,01) = 2,33.

4.2. Оценка точности определения признаков

105

значение и дисперсия явно выражаются через такие интегралы 1. Сле­ довательно, применение подобных интегралов для определения призна­ ков и распознавания имеет еще одно преимущество, заключающееся в том, что аппроксимирующие суммы нормально распределены, что позволяет использовать хорошо известные процедуры статистических решений. Мы можем каждой паре, состоящей из определенного образа и интеграла вида Д„, оцененного на этом образе, присвоить функцию нормальной плотности вероятности с известным средним значением и дисперсией. Это соответствие между геометрическими признаками образа и нормальной плотностью вероятности позволяет нам оцени­ вать вероятность неверного распознавания, когда единичный признак используется для классификации неизвестного объекта, т. е. для отне­ сения его к одному из классов или образов. Например, будем считать, что в качестве признака распознавания используется длина контура. Для определения параметров, соответствующих нормальной плотности, нужно найти предполагаемые значения характеристической функции этих образов.

Если образы Fi располагаются на сетчатке Ф с длиной границы Lф ,

то

М<5д\ = Е/л/Еф = P i .

Дисперсия составит

BdFi= P i ( \ - P i ) .

Как отмечалось, на основании центральной предельной теоремы мы связываем с образом Fi нормальную плотность вероятности, что создает предпосылки для применения теории статистических решений для оценки надежности распознавания. Если предположить равными априорные вероятности появления двух каких-либо образов и допу­ стить, что дисперсии не являются несоизмеримыми, то можно, исполь­ зуя теорию решений [9, 119], показать, что вероятность ошибки при стохастическом распознавании образов

Р(е) = 1“ ф ( VW+ Ж ’ (4'9)

где Ф является нормально распределенной функцией с нулевым сред­ ним и единичной дисперсией.

Из этой формулы видно, что увеличение Дф без соответствующего увеличения Ьр приводит при фиксированном N к повышению веро­ ятности ошибки распознавания; увеличение N вызывает уменьшение вероятности неверного распознавания. Формула (4.9) связывает такие важные характеристики, как надежность распознавания, определяемую вероятностью ошибки, быстродействие и производительность распо­ знающего устройства, зависящие от числа шагов N сканирующей системы.

1 Напомним, что условием применимости центральной предельной теоремы является существование конечного среднего и дисперсии подынтегрального выражения.

106Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

Вкачестве примера приведем численные оценки интеграла I\ (2.19), полученные при сканировании случайными линиями двух фигур: круга

ипрямоугольника с соотношением сторон а / Ъ = 2. При значениях периметров этих фигур Lpi , равных Ьф, относительная погрешность, определяемая по формуле (4.8), составила 3,6% для круга и 6,3 % для

прямоугольника

при числе шагов развертки Ж = 231. При уменьше­

нии Lpi в два

раза (Lpi = Ь ф / 2 ) относительная погрешность соста­

вила 9,7% для круга и 10,9% для прямоугольника при числе шагов сканирующей системы Ж = 462.

При заданной относительной ошибке 2,5% оценивание 1\ на круге, периметр которого составляет Lpt = Ьф/2, требует Ж = 7 • 103 шагов сканирующей системы.

Оценивание 1\ на прямоугольнике, периметр которого составляет Lpt = Ьф/2, с точностью 1,1% требует N = 7 104 шагов сканирующей системы.

Следует подчеркнуть, что даже при таком большом числе шагов сканирующей системы, как в последнем случае, распознающая система может вести обработку изображений с высокой скоростью (порядка сотен изображений в секунду) при использовании в качестве источни­ ка сканирующего луча современных малоинерционных инжекционных лазеров.

Рассмотрим теперь сканирование изображений случайными отрез­ ками линий, осуществлённое в распознающей системе [40], архитекту­ ра которой рассмотрена в § 1.1. В § 2.3 приведена оценка вероятности Р пересечения отрезка с изображением объекта в виде решетки парал­ лельных линий. Как отмечалось, если отрезок случайно бросается Ж

раз и при бросках получается хотя бы одно пересечение, то Р = пЖ_| есть несмещенная оценка для Р с дисперсией Ж_ 1Р( 1 —Р). Макси­ мальное значение дисперсии D = 0,25M_I (т. е. наихудший случай), отсюда среднеквадратическое отклонение а = 0,5Ж-1/2. Теорема Бюффона дает для вероятности пересечений Р значение 2/ 7г. Используя это значение, мы можем оценивать относительную ошибку распознавания для образа, представляющего решетку параллельных линий с интер­ валом между линиями, равным длине отрезка. Она приблизительно равна Ж-1/2. Следовательно, если при распознавании относительная ошибка определения вероятности Р должна быть порядка 3%, то необходимо, чтобы число бросаний отрезка или, иначе говоря, число шагов сканирующей системы было Ж = 103. Как показали экспери­ ментальные исследования, это число шагов достаточно для получения системы непересекающихся числовых интервалов, выполняющих роль эталонов при распознавании.

Отметим еще раз, что оценка относительной ошибки при сканиро­ вании случайными отрезками проводилась для образов в виде решеток линий. Вообще говоря, можно получить такие оценки и для других геометрических элементов, например, для окружности и для отрезка прямой линии. Но уже для буквы Р оценки будут неприемлемыми из-

4.3. Экспериментальная оценка алгоритмов

107

за их некоррелированности, хотя эту букву и можно представитв в виде композиции отрезка прямой и окружности.

Поэтому в целом вопрос об оценке дисперсии и погрешности по­ лезнее решатв не теоретически, а экспериментально по результатам анализа множества изображений объектов одного образа.

4.3. Экспериментальная оценка алгоритмов стохастического распознавания

При сканировании со случайными параметрами результат пересе­ чения изображения с разверткой можно рассматривать как наблю­ дение случайной величины. Следовательно, информацию об объекте, которую несет эта случайная величина, можно извлекать не только усреднением, но и с помощью основных процедур статистической классификации. Преимущество такого подхода заключается в том, что в качестве характеристики объекта можно использовать полное рас­ пределение наблюдаемой случайной величины, поэтому на этом пути достижима большая гибкость распознавания, чем при использовании только средних значений.

Пусть, например, для распознавания предъявляются объекты, отно­ сящиеся только к двум образам. Допустим, классификация осуществ­ ляется по размеру площади, которая определяется путем оценивания интеграла Д, который зависит от длины хорды д, высекаемой распо­

знаваемым объектом на случайной сканирующей линии: Д = ^g d G =

= TTS. Таким образом, этот служащий критерием распознавания ин­ теграл связан со случайной переменной ф(д, г), зависящей от длины хорды и номера образа. Прямое оценивание Д требует довольно-таки большого числа шагов сканирующей системы. Вместе с тем допустимо, рассматривая длину хорды как случайную величину х и зная функцию плотности распределения этой случайной величины /(ж) для каждого из двух образов, применять байесовскую теорию решений для распо­ знавания. Пересечение сетчатки распознающего устройства одной слу­ чайной линией порождает наблюдение, которое приписывается обычно объекту с наименьшей апостериорной вероятностью ошибки. Однако возможен случай, когда однократное сканирование изображения слу­ чайной линией дает недопустимо высокую байесовскую вероятность ошибки. Эта ситуация схожа с описанием образа с помощью не очень информативной системы признаков. Один из путей преодоления этих трудностей заключается в использовании нескольких шагов развертки: случайно бросают несколько линий, каждая из которых дает независи­ мое решение в пользу одного из образов, далее подсчитывается число независимых решений для распознавания образов. Более эффектив­ ный подход состоит в обращении к теории последовательных реше­ ний, которая позволяет минимизировать среднее число наблюдений, а, следовательно, и число шагов сканирующей системы распознающего устройства.

108 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

Идея применения последовательного анализа заключается в следующем. Наблюдения за результатом сканирования случайными линиями изображений объектов представляются в виде последова­ тельности случайных величин ф\, ф2, ■■■, ФN, каждая из которых, как отмечалось, зависит от длины хорды и номера образа, причем количество этих величин, соответствующих числу шагов развертки, не фиксировано, и это дает при распознавании дополнительную «степень свободы», которая способствует достижению большей гибкости распознавания. Последовательный анализ в данном случае указывает, какое из трех действий следует предпринять после получения очередного результата tpN сканирования изображения: отнести объект к первому образу, отнести его ко второму образу или выполнить еще один шаг развертки, т. е. пересечь изображение новой случайной сканирующей линией. При последовательном анализе обычно стремятся минимизировать среднее число наблюдений.

Предположим, что случайные величины ф\,ф2 , ■■■>ipN могут рас­ пределяться в соответствии с одной из двух функций распределения с плотностью вероятности f\(x) и / 2 (2 :), характеризующих объекты, относящиеся к первому и второму образам. Существует два типа оши­ бок, которые могут быть совершены при классификации: первого рода, когда принято решение, что существует функция плотности вероятнос­ ти fi(x), в то время как фактически существует / 2 (3 :), и второго рода, когда имеет место обратная ситуация. Допустим, мы требуем, чтобы вероятности этих двух ошибок не превышали а и (5 соответственно. Тогда решающая процедура, обеспечивающая минимальное среднее число наблюдений при заданной допустимой вероятности ошибки, определяется тестом Вальда. Тест заключается в том, что прежде всего определяются два положительных числа А и В с учетом требований, предъявляемых к ошибкам первого и второго рода:

1 -/3

В <

р

Л ^

1 а

а

 

Полагая, что ф\, ф2, ■■■>Фи являются наблюдаемыми случайными величинами, для каждого наблюдения N вычисляют отношение прав­ доподобия

N

Ь м { Ф \, Ф 2 ,• • • , Фы) =

fl(Pk)

k=1 Н Ф к )

и сравнивают его с А и В. Если Ддг лежит между А и В, анализ продолжается для следующего (W+1) наблюдения, т. е. делается еще один (N + 1 )-й шаг случайной развертки. Если Тдг > А либо Тдг < В, выборка оканчивается и принимается решение о существовании

т. е. первого образа, если LN > А, и второго образа, если L N <B. Ясно, что число наблюдений N зависит от значения наблюдаемой слу­ чайной величины и, таким образом, является случайной переменной.

Вообще говоря, последовательный анализ применим для решения задач с большим числом образов. Мы рассматривали случаи двух об­ разов, поскольку описываемые эксперименты заключались в отнесении

4.3. Экспериментальная оценка алгоритмов

109

предъявляемых для распознавания геометрических фигур к двум клас­ сам, или образам. В эксперименте по распознаванию геометрических фигур применялосв сканирование случайными линиями и наблюдаемой величиной бвша, как и в рассмотренном ранее примере, длина хорды, высекаемая на случайной прямой распознаваемой фигурой. В ходе экс­ перимента определялись плотности вероятностей f\(x) и / 2(ж) для двух образов по формулам, приведенным в предшествующем параграфе, затем применялся последовательный тест Вальда для распознавания. Главными переменными каждого эксперимента являлись а, /3 и размер сетчатки.

Роль размера сетчатки важна, так как при его увеличении возрас­ тает число случаев, когда линия развертки не пересекает изображение объекта. Это означает, что наблюдаемая в такие моменты случайная величина не является информативной. С помощью математической символики этот факт можно отразить следующей записью функции распределения наблюдаемой случайной величины:

F(x) = Р0 + (1 Ро

f{x') dx', х > 0;

F(x) = О,

х < О,

где Ро > 0 — вероятность того, что длина пересечения равна 0; f(x) — функция плотности вероятности.

Итак, эффект возрастания размера сетчатки (причем речь идет лишь о периметре, а не о форме) проявляется в увеличении Ро. Пусть Fi{ x), i= 1,2 есть функция распределения; fi(x), i = 1,2 — плотность вероятности; PQ — рассмотренная вероятность непересечения скани­ рующей линией изображения соответственно для первого и второго образов. Функция L(x) определится для х > 0 следующим образом:

 

L ( x ) =

~ E 5 '

х = 0 ,

 

 

М)

 

 

Ь(х) = 7 7 -т .

х > 0.

 

 

/ 2 (ж )

 

Тогда для последовательных наблюдений х \,х ^,... , X N будем иметь

 

 

 

N

L N

{X 1 , ж 2 ........... X N ) = Д р ( ж ; ) .

 

 

 

г=1

Последовательный

анализ,

как было пояснено раньше, состоит

в вычислении Рдт и сравнении со значениями А и В. Если сетчатка pi

большая, тогда —^ примерно равно единице, и обе вероятности PJ Ро

и PQ близки к единице. Это значит, что в данном случае существует большая вероятность того, что Рдг и Рдг+i примерно равны. Очевидно, что такая ситуация будет требовать большего числа экспериментов для достижения решения.