Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

1.3. Формирование случайных параметров сканирования

31

происходит согласно закону отражения света (угол падения равен углу отражения), угол между прямой G и касательной к Г и угол <р* между отраженной прямой G* и касательной равны: <р* = —ip. На основании формулы (2.6) для dG (абсолютное значение) можно сделать вывод, что dG = dG*. Поэтому плотность dG инвариантна относитель­ но отражений.

Пусть прямая G, являющаяся проекцией сканирующего луча, пре­ ломляется поверхностью, плоское сечение которой есть кривая Г (рис. 1.9). Поверхность разделяет две среды с показателями прелом­ ления п\ и П2 . Пусть i\ является углом падения, а гг — преломления, тогда согласно закону преломления света Снеллиуса

 

 

siП %| П2

 

 

sin гг

щ

При этом углы между

касательной к поверхности и прямыми G\

и (?2 соответственно

 

 

 

 

ч>\ =

 

2 - н;

2 = 2 “ *2'

На основании (2.6)

 

 

dG 1 = —cos i\dc A di\

= —dc A d(sinii);

dG2 = —cos t2 dc A d%2

= —dc A d(sin гг) =

 

 

=

(—n \/n 2)dcA d(sinii) = (n\/n,2)dG\.

Итак, при преломлении луча от среды с показателем преломле­ ния п\ к среде с показателем преломления ггг плотность dG\ умно­ жается на постоянный множитель щ /п 2 .

Рассмотрим оптический прибор, включающий несколько оптиче­ ских сред с показателями преломления щ,П 2 , ... ,пт, такими, что первая среда, куда лучи входят, идентична последней среде, из ко­

торой

лучи выходят,

т. е. п\ = пт. В этом

случае будет справедливо

равенство

 

 

 

dGm =

(ггт _ 1

1

= (ггт —i^m_2)/(nm7im_i)rf(jm_2 =

 

 

=

(тето_1 .. .щ )/(п тпт - 1

. ..n 2)dGi = dGi. (1.33)

Отсюда следует важный вывод, что плотность прямых сохраняется при их проецировании с помощью оптических приборов [31].

Итак, в данной главе рассмотрены элементы теории меры. Несмотря на некоторое естественное замедление темпа в чтении книги из-за обилия формул, мы не только проделали нужную работу для пони­ мания идейной стороны применяемого математическою аппарата, но и получили важные предпосылки для технического воплощения рас­ познающей системы. Ибо, как было показано выше, нестрогое вероят­ ностное мышление проектировщика распознающей системы приводит к парадоксальным ситуациям при попытке решать самые, казалось, простые задачи стохастического распознавания образов. Как мы уста­ новили, при проектировании распознающей системы необходимо зада­ вать случайные параметры развертки в специальном параметрическом

32 Гл. 1. Принципы построения системы распознавания образов

пространстве, отличном от пространства координат, в котором работает развертка. В связи с этим возникает необходимость функционально­

го

преобразования

случайных параметров для обеспечения принци­

па

инвариантности,

т. е. независимости распознавания от положения

и ориентации объекта. Далее отметим, что, вооружившись знанием элементов теории меры, мы будем иметь мощный аппарат для реше­ ния задач распознавания образов и получения системы инвариантных признаков распознавания. Дело в том, что многие теоремы стохастиче­ ской геометрии получаются интегрированием плотностей множеств по частным областям. Характер этих областей зависит от геометрических событий, под которыми, напомним, мы понимаем результат взаимодей­ ствия геометрических элементов. В нашем случае будем рассматривать взаимодействие геометрических элементов: линий, кривых, фигур, ко­ торые имеют место из-за сложной формы траектории сканирования, с объектами, подлежащими распознаванию. Причем те теоретические положения, которые получаются при анализе геометрических событий, очень важны для нас, ибо они, как правило, и дают объективные признаки распознавания, инвариантные к изменению положения рас­ познаваемых объектов в пространстве.

Эти теоретические положения подробно рассмотрены в книге Сантало [31]. Следуя Сантало, автор приводит по мере необходимости некоторые теоретические положения, в ряде случаев опуская доказа­ тельства и заменяя их геометрическими иллюстрациями и логическими рассуждениями.

ГЛА ВА 2

ТРАЕКТОРИИ СКАНИРОВАНИЯ И ИНВАРИАНТНЫЕ ПРИЗНАКИ РАСПОЗНАВАНИЯ

2.1. Сканирование случайными линиями

Рассмотрим входную сетчатку распознающей системы, под которой в данной главе мы будем понимать сканируемую часть плоскости изоб­ ражения. Изображение объекта будем интерпретировать как некоторое множество на сетчатке [21, 43]. В связи с этим рассмотрение процес­ са сканирования изображения объектов случайными линиями начнем с изучения свойств пересечений множеств со случайными линиями.

Случайные прямые, пересекающие множества. В предшествую­ щей главе мы воспользовались мерой множества прямых, пересекаю­ щих ограниченное выпуклое множество F:

H{G\ G П F ф 0)

dpAdO = L,

( 2. 1)

GnF^0

где L — длина границы множества F (периметр множества F). В со­ ответствии с оговоренным выше условием интеграл в выражении (2 .1) представляет собой сокращенную запись двойного интеграла, причем интегрирование распространяется на все прямые G, имеющие с мно­ жеством F общие точки. Покажем, что он с помощью приведенной ниже последовательности преобразований в двукратный интеграл и выполнения интегрирования действительно становится равным L:

2тг 2тг

dp A dO

dd dp = pdO = L.

( 2.2)

Опду0

Переход от последнего интеграла в этой цепи преобразований к L ясен из следующего замечания: когда 9 получает приращение dO, соответствующий элемент длины границы dL = pdO.

Соотношение (2.1) приобретает вероятностный характер в тех слу­ чаях, когда некоторое выпуклое множество F содержится в ограни­ ченном выпуклом множестве Ф. Вероятность того, что случайная

3 Федотов Н. Г.

34 Гл. 2. Траектории сканирования

прямая G пересечет F, если она пересекает Ф, P(F) = Lp/Ьф, где

Ьр и Ьф, где Ьр и Ьф длины границ множеств F и Ф.

Этот результат можно распространить и на случай, когда невыпук­ лое множество F содержится в выпуклом ограниченном множестве Ф. Вероятность их пересечения также будет определяться отношением длин, однако в этом случае в числителе будет фигурировать не длина границы множества F, а длина выпуклой оболочки множества F (вы­ пуклой оболочкой F называется наименьшая выпуклая фигура, которая содержит множество F). В этом случае формула для определения веро­ ятности пересечения получает более универсальную форму, поскольку для выпуклых множеств длина выпуклой оболочки совпадает с длиной границы множеств.

Итак, если Ф является сетчаткой, а под множеством F понимать некоторый распознаваемый объект на сетчатке, тогда можно считать, что при сканировании случайными линиями вероятность пересе­ чения объекта случайной линией P(F) = Ь*р /Ьф, где L*F — длина выпуклой оболочки F; Ьф — длина границы сетчатки Ф.

Может возникнуть вопрос, почему интересующая нас вероятность находится в зависимости от выпуклой оболочки множества, под ко­ торым мы условились понимать распознаваемый объект. Объяснение заключается в том, что прямая пересекает объект только тогда, когда она пересекает его выпуклую оболочку. Таким образом, формула для вероятности пересечений P(F) представляет собой лаконичную запись интуитивно ясного положения, что чем больше объект по сравнению с размером сетчатки, тем больше вероятность его пересечения случайной линией.

Итак, рассматриваемую вероятность, содержащую информацию о длине выпуклой оболочки объектов, можно выбрать в качестве призна­ ка распознавания и по этому признаку классифицировать предъявляе­ мые изображения. Например, если объектами являются буквы А и Д, то можно воспользоваться различием длины их выпуклой оболочки для распознавания этих букв, имеющих топологически сходную структуру. Топологическое сходство рассматриваемых букв состоит в том, что они содержат одну замкнутую и одну открытую область. Поэтому, если в некоторой распознающей системе распознавание символов произ­ водится только на основе топологических признаков, данные буквы будут неразличимы, в то время как добавление нового признака, например, рассматриваемой длины выпуклой оболочки, делает такое распознавание выполнимым. Причем, если различие длин выпуклых оболочек объектов составляет 10 % и выше, не представляет техниче­ ских трудностей реализовать такое распознавание с высокой надеж­ ностью и достаточно просто. Таким образом, рассматриваемые веро­ ятности пересечения объектов случайными линиями развертки несут информацию о длине выпуклых оболочек объектов и могут служить критерием распознавания. Одним из ценных свойств распознавания по такому критерию является независимость его относительно изменения положения объектов на сетчатке.

2.1. Сканирование случайными линиями

35

Рассмотрим два выпуклых множества F\ и F2 , таких, что F2 цели­ ком лежит вне £ , т. е. это — непересекающиеся множества. Обозначим длину границв1 £ и F2 через Ь\ и L2 соответственно. Как и в предшествующем случае, определим вероятноств того, что случайная хорда F\ пересекает F2 , или вероятноств пересечения сканирующей линией F2 при условии, что она пересекает £ . Проведем четыре общие касательные к границам множества А А ', В В ', С С , DD', причем последние две пересекаются в точке О между контурами (рис. 2.1).

Кривая, состоящая из касательных АА! и В В ' и фрагментов границ F\ и F2 , является выпуклой оболочкой объединения множеств F\ U £2, ее интуитивно можно представить как туго натянутый шнур, охватываю­ щий £ и F2 и не имеющий точки пересечения. Обозначим ее Г12, а ее длину Ь\2 . Кривую Г'12, образованную касательными DD', С С и фраг­ ментами границы множеств F\ и F2 , можно зрительно представить как шнур, туго натянутый вокруг F\ и F2 , имеющий самопересечение в точке О. Пусть Ь\2 — длина этой кривой. Обозначим через Е\ и £2 выпуклые множества, границей которых являются пересекающиеся касательные и фрагменты границ множеств, т. е. граница Е\ проходит через точки AD O C B , а граница £2 — через A 'C O D ' В '.

Анализируя рис. 2.1, можно составить равенство: (мера хорд Е\) + (мера хорд £ 2) =

=

(мера

всех

прямых,

которые

пересекают Е\ либо £ 2) +

+

(мера

всех

прямых,

которые

пересекают как Е\, так и £ 2).

Из рассмотренного выше свойства пересечения множества случай­ ной прямой следует, что левая сторона этого равенства равна сумме периметров Е\ и £ 2, т. е. £ 12. Поэтому мера прямых, которые пересе­ кают их одновременно, равна 1/12 —£ 12. и в силу того, что мера всех прямых, пересекающих £ , равна Ь\. Искомая вероятность в результате

Ь[2 - Ь\2

и '

В общем, при сканировании случайными линиями объектов, под­ лежащих распознаванию и дающих возможность интерпретировать их как непересекающиеся множества, могут быть определены следующие

з*

36

Гл. 2. Траектории сканирования

вероятности, на основе которых строятся признаки распознава­ ния. Эти вероятности получены с помощью рассуждений, подобных предыдущему. Формулы для их определения приводятся ниже.

1. Вероятность того, что случайная линия G пересечет F\ и F2,

P{GC\FXC\F2 ф ® )= L'l2~ Ь{2.

 

 

F\2

 

2.

Вероятность того, что G пересечет F\, но не пересечет F2,

 

P (G D F l ^ 0 ; G П F2 = 0) =

1 -

L'12 ~ L l .

 

 

 

L 12

3.

Вероятность того, что G пересечет F2, но не пересечет Fi,

 

P(G П Fi = 0 ; G П F2 ф 0) =

1 -

- Ц —

 

 

 

^12

4.

Вероятность того, что G разделяет F\

и F2,

P(G n F i = 0 ; G П F2 = 0; С П Г 12 ф 0 ) =

L 12 ~ (Li + L2)

 

 

 

b l2

Если множества У) и F2 пересекаются, то в приведенных формулах надо считать, что Z/12 = Fi + Ь2.

Представленные выше результаты принадлежат Сильвестру [35], который рассмотрел также случай с большим числом выпуклых мно­ жеств. Часть из них приведена в [17, 31, 105]. Эти результаты представ­ ляются полезными для построения алгоритмов распознавания символов в читающих автоматах, при анализе микрообъектов биологической природы.

Рассмотрим некоторую область Q площадью S, сканируемую слу­

чайными

прямыми.

Умножим

обе

части уравнения,

описывающе­

го плотность

множества прямых в

нормальных координатах: dG =

= dp Add,

на

длину

хорды д,

которая является частью прямой G,

лежащей внутри границы Q, или частью прямой, высекаемой обла­

стью Q. Проинтегрируем полученное уравнение по всем прямым G,

пересекающим Q:

 

 

р

 

 

 

 

 

 

 

 

 

д dG

dd д dp = irS.

(2.3)

 

 

GnQ=p0

О

О

 

Действительно, gdp является элементом площади Q, интеграл от­ носительно dp для фиксированного в есть площадь S и интегрирование по переменной в дает ж, поскольку в изменяется от 0 до ж. Требуется, по-видимому, пояснить, почему при выводе формулы (2 .2) мы брали предел от 0 до 2л, а в данном случае от 0 до ж. Дело в том, что там мы имели дело с ориентированными прямыми, в последнем же случае речь идет о длине хорды д, не зависящей от ориентации. Заметим, что этот же результат мы бы получили автоматически, даже если предел изме­ нения угла в взят от 0 до 2л, ибо, поскольку у двух линий, по-разному ориентированных, длина высекаемого отрезка будет одинакова, то при интегрировании произойдет сокращение на множитель 2 .

2.1. Сканирование случайными линиями

37

Случайные линии, пересекающие кривые. Для распознавания изображений объектов, носящих контурный характер, или таких изоб­ ражений объектов, у которых очень информативна граница, значитель­ ный интерес представляют модели, связанные с пересечением случай­ ных линий с кривыми.

Рассмотрим кусочно-дифференцируемую кривую Г. Предположим, что Г имеет конечную длину L и что она задана параметрическими уравнениями

х = х(с); у = у(с),

в которых параметр с является длиной дуги. Рассмотрим прямую G, пересекающую кривую Г в точке (х ,у ) и образующую с касательной, проведенной к кривой в этой точке, угол р. Задание параметра с и соот­ ветствующего ему угла р определяет прямую G. Выразим плотность dG через координаты с и р .

Обозначим через т угол между касательной к Г и осью х, тогда

в = р + т -

(2.4)

Поскольку х, у — точки прямой G, то

 

р = х cos в + у sin в

 

и, следовательно,

 

dp = cos в dx + sin 9dy + (—x sin в + у cos в) d6.

 

Учитывая, что dx = cos rdc и dy = sinrdc, получаем

 

dp = cos(d —r)d c+ (—ж sin# + ycosd) d9.

 

Умножая внешним образом на dd, приходим к равенству

 

dp А dd = cos(d — т) dcA dd.

(2.5)

Из формулы (2.4) следует, что dO = dp + т' dc. поскольку т есть функция только от с. Выполним подстановку этого выражения для dd в уравнение (2.5):

dG = dp A dB = |sin p\ dc A dp.

(2.6)

Это еще одна из полезных для приложений форм плотности мно­ жества прямых dG. Синус берется по абсолютной величине, так как по определению все плотности предполагаются неотрицательными.

Проинтегрируем теперь обе части равенства (2.6) по множеству всех прямых G, которые пересекают кривую Г. Правая часть равенства

дает

L

dc |siny>| dp = 2L.

оо

При вычислении левой части необходимо иметь в виду, что каждую прямую нужно считать столько раз, сколько она имеет точек пересече­ ния с кривой Г. Обозначая это число п, получаем

п dG = 2L,

(2.7)

а

38 Гл. 2. Траектории сканирования

где за область интегрирования можно принять множество всех прямых плоскости, ибо для прямых G, не пересекающих Г, п = 0.

Следует подчеркнуть, что какова бы ни была форма кривой: чрезвы­ чайно сильно скрученной, либо напротив, растянутой, результат будет один и тот же, т. е. формула (2.7) носит универсальный характер. Такое свойство может показаться на первый взгляд необычным, ибо ожидается, что большее число прямых пересекают растянутую кривую, нежели сильно скрученную. Объяснение состоит в том, что, когда пересекается прямой линией сильно скрученная кривая, пересечение происходит в большем числе точек; таким образом, п возрастает. Этим объясняется форма уравнения (2.7).

Рассмотрим случай, когда Г представляет собой замкнутую вы­ пуклую кривую. При пересечении её случайными прямыми для всех прямых, пересекающих кривую Г, п = 2. Исключение составляют пря­ мые, касающиеся Г, однако мера такого множества прямых равна нулю.

Учитывая вышесказанное, получаем

 

(1G = L.

(2.8)

G

 

Итак, мера множества прямых, пересекающих выпуклую кривую, равна длине этой кривой. Таким образом, для выпуклой кривой снова получается результат (2 .1).

Соотношения (2.7) и (2.8) приобретают вероятностный характер, если рассматривать спрямляемую кривую Г длиной L, расположенную внутри замкнутой выпуклой кривой Гф, длина которой равна Ьф. (При решении задач распознавания образов под замкнутой выпуклой кривой ГФ мы будем понимать границу сетчатки Ф.) Для этого случая можно определить среднее значение числа пересечений п кривой Г со

случайной прямой:

2L

jn d G

J dG

(2.9)

Ьф

Ниже в главе 4 обсуждается характер распределения этой вели­ чины, и рассматриваются моменты второго порядка, которые важны для нас в практическом смысле, на них основана оценка точности измерения длины кривой по формуле (2.9).

Итак, пусть при решении задачи распознавания образов мы име­ ем дело с контурными объектами, отличающимися длиной контура. (Заметим, что объекты могут и не быть кривыми в строгом смысле этого слова; в качестве примера объектов такого рода укажем на изображение цифры 5 или микротрещины в материале.) В этом случае мы можем распознавать объекты, сканируя их случайными линиями

иподсчитывая число пересечений объекта с линиями развертки. Это число, как мы видим, будет вероятностной оценкой длины контура

иможет служить признаком распознавания. Система, реализую­ щая такой алгоритм распознавания, получается достаточно простой,

2.2. Система со сканированием случайными прямыми

39

поскольку распознавание объектов частично совмещается со сканиро­ ванием, а решающая процедура заключается лишь в подсчете сигналов пересечения [39, 40].

Преимуществом данного метода распознавания является устойчи­ вость его к локальным дефектам изображений объектов: небольшие разрывы контура, вкрапления черного и помарки на фоне не будут сказываться на достоверности распознавания. Распознавание образов по критерию длины границы можно было бы реализовать с исполь­ зованием следящей системы. Однако в этом случае при отслеживании границ локальные дефекты, разрывы контура, неоднородность фона бы­ ли бы труднопреодолимым препятствием. В этом случае отслеживанию границ должна была бы предшествовать предварительная обработка изображения, основанная на фильтрации. Однако, как показано в [21], фильтрация сама по себе может приводить к появлению некоторых спе­ цифических искажений, в частности к нарушению fc-связности изобра­ жения, т. е. формированию пустот внутри контура, а также стиранию коротких элементов изображения и замыканию близко расположенных штрихов.

2.2. Система со сканированием случайными прямыми для анализа и распознавания биологических объектов из области нанотехнологий

Объектами для анализа и распознавания являются изображения 1 молекул ДНК, представленные на рис. 2.2 (см. цветную вклейку).

В результате анализа необходимо было выделить характерные об­ ласти на ДНК: спиралевидные участки цепочки ДНК, петлеобразные на плоской проекции ДНК, разветвления, наметить граничные точки перехода с одного характерного участка ДНК на другой и, наконец, в качестве главного признака распознавания с максимальной точностью определить длину цепочки ДНК.

Существуют два режима работы программной системы: интерак­ тивный и «пакетный». В интерактивном режиме пользователь может менять способ и параметры нелинейной фильтрации для предваритель­ ной обработки изображений. Когда результаты обработки некоторых

изображений формируются в

«пакетном» режиме работы системы,

то на вход системе передается

каталог с исходными изображениями

вформате «*.Ьтр», а на выходе — каталог с набором изображений предобработки, а также отдельные каталоги для хранения фрагмен­ тов ДНК.

1Изображения получены с помощью микроскопа фирмы «NT-MDT», работающего

внанодиапазоне [51, 82, 86, 88].