Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

3.5. Признаки параметры трещин в материалах

91

На множестве прямых линий G, как показал Пуанкаре, единствен­ ным инвариантным дифференциальным элементом, на основе которо­

го строится

инвариантная или

кинематическая мера p(G), является

dp Add (см.

§1.2). При этом

прямая линия задается нормальными

координатами — полярными координатами точки пересечения прямой с перпендикуляром, опущенным на нее из начала координат (р, в).

Множество прямых интересует нас потому, что в основе предложен­ ного метода измерения лежит анализ точек пересечения изображения трещины со случайным множеством отрезков прямых линий дискрет­ ных оптических фильтров, играющих роль случайной входной сетчатки системы [42] (см. приложение В).

Алгоритм измерения параметров трещины осуществляется при та­ ком подходе путем вычисления средневзвешенной меры всех линий

фильтра, которые пересекают изображение трещины:

 

пр(р,в) dp A dd,

(3.31)

ф

где пр (р,в) обозначает число пересечений линий фильтра (р, в) с изоб­ ражением трещины F, расположенной в области Ф входной сетчатки измерительного устройства (в данном случае проецируемого на экран телевизионной передающей электронно-лучевой трубки — мишень видекона).

Ограничение области интегрирования размерами экрана А поз­ воляет провести нормирование кинематической меры и осуществить переход к вероятностным мерам, а, следовательно, к вычислению гео­ метрических вероятностей.

Пусть Сф является подмножеством тех элементов G, которые про­ ецируют на экран Ф. Для подмножества прямых Gp, пересекающих F, вероятностная мера

P{F) =

2 .

( 3 . 3 2 )

 

Р[Стф)

 

Функция Р (Р ) определена на таком же числе объектов, что и p(F), и является вероятностной мерой.

Если F — изображение некоторой трещины общей длиной До и площадью SQ, спроецированное на круглый экран радиусом R, то на основе вычисления (3.31) и (3.32) и с учетом (2.37) и (2.38) можно оценить вероятности пересечения F с линиями фильтра длиной I (на оптической проекции):

_ 21Ьр

(3.33)

1“ 7Г2Д2 + 2тгRI

а с учетом толщины трещины

TYSQ+ ILo

(3.34)

2 “ тгД2 + 2irR '

Как видно из приведенного примера, вероятности Pi и Рг содер­ жат информацию о длине трещины и ее площади. Следовательно,

92 Гл. 3. Геометрические решётки и признаки распознавания

геометрические вероятности подобного вида могут быть использованы в качестве оценок параметров трещин при испытании.

Таким образом, предлагаемый алгоритм измерения является раз­ новидностью метода Монте-Карло и предполагает определение доста­ точно большого числа пересечений изображений с линиями филь­ тра. Вычисление оценок геометрических вероятностей вида Р\, Р2 , ...

производится с дисперсией Р*(1 —Pi)N~l, где N — число линий фильтра. Оптимальное число N, определенное из условий достаточной точности измерения и простоты выполнения фильтра, равно 103. При таком N верхняя оценка дисперсии равна 0,2510_3. Среднеквадрати­ ческое отклонение, или точностной допуск метода измерений, состав­

ляет 1,6 • 10-2 .

Следует отметить, что примененная система оптической дискрети­ зации изображения до его сканирования дает возможность нейтрали­ зовать основные факторы, вносящие погрешность при телевизионных измерениях, а именно нелинейность развертки, геометрические иска­ жения и изменение размеров растра. Благодаря применению фильтра воздействие этих факторов скажется лишь на изменении частоты и фазы следования получаемых видеоимпульсов, а не их числа и дли­ тельности, которые определяют размер трещины. Причем, поскольку трещина - объект нестационарный, регулярные штрихи на фильтре давали бы большую вероятность ошибки по сравнению со случайными, ибо в ряде случаев направление роста трещины совпадало бы с распо­ ложением непрозрачных участков на фильтре. Экспериментально опре­ деленная точность измерений параметров трещины составила 1,5% (при N = 103), что достаточно для целей решаемой задачи.

ГЛАВА 4

НЕКОТОРЫЕ ОЦЕНКИ АЛГОРИТМОВ СТОХАСТИЧЕСКОГО РАСПОЗНАВАНИЯ

4.1. Замечания о форме траектории сканирования

Круг смежных задач, возникающих при распознавании сложных изображений, необычайно широк: уменьшение зашумленности и филь­ трация, выделение признаков, эффективное кодирование [4, 33]. Кроме распознавания образов аналогичные задачи возникают и при анализе изображений в различных областях техники, при передаче изображе­ ний по линиям связи. Для решения этих задач, как правило, необ­ ходим этап преобразования двумерного информационного массива в одномерный. Это связано с тем, что используются методы, хорошо развитые в технике связи для обработки одномерных временных сиг­ налов, а также с последовательным принципом действия современных компьютеров, линейной адресацией их памяти. Для преобразования многомерного сигнала-изображения в одномерный используется скани­ рование, причем, как правило, построчное или постолбцовое. Такое сканирование обусловлено, видимо, историей развития техники — на этапе создания электронных сканирующих систем приемлемым для технической реализации оказался генератор линейно изменяющегося напряжения, основанный на разряде конденсатора и обеспечивающий построчную развертку. Кроме того, некоторые традиции из других сфер человеческой практики построчная письменность, кни­ гопечатание привели к практически полному преобладанию в системах обработки изображений построчной или телевизионной развертки.

Вместе с тем существуют иные виды разверток, позволяющие с меньшими потерями отобразить окрестность каждой точки изображе­ ния в одномерном массиве [4, 5]. Современная технология, а также эле­ ментная база (интегральные схемы, микропроцессоры) позволяют без особых затруднений реализовать любой сложный вид сканирования. О перспективности таких сложных разверток свидетельствуют и ан­ тропоморфные характеристики процесса распознавания. Как показали исследования, при распознавании сложных изображений человеческий взгляд перемещается по сложной траектории со случайными парамет­ рами [6, 7].

94 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

Как отмечает известный специалист В. В. Сергеев, с позиций про­ блемы распознавания образов простейшие способы построчной разверт­ ки, производимой с целью последующей обработки одномерных мас­ сивов данных, «оказываются недостаточно эффективными, так как не всегда учитывают характерные особенности изображений как объектов обработки: двумерный характер статистических связей, наличие конту­ ров, однородных областей и т. д. Учет указанной специфики позволяет повысить качество обработки, но приводит к усложнению соответ­ ствующих алгоритмов. Развитие алгоритмов обработки изображений в основном и идет по пути совершенствования способов использо­ вания “двумерности” обрабатываемых данных, не сопровождающихся чрезмерным ростом реализационной сложности» 1. Одна из основных идей, развиваемых в книге, заключается в том, что предлагается учесть особенности изображения не на этапе обработки данных, а раньше — на этапе сканирования изображений, когда эти данные только формируются.

Многочисленные формулы, приведенные в главе 2 для различных траекторий сканирования, и есть средство отображения такой «дву­ мерности», т. е. статистической связи между точками изображения, которая проявляется через геометрию образов. В этом особенность развиваемого в книге подхода.

В главе 2 рассматривались и исследовались различные виды ска­ нирования с точки зрения их информативности. На основе анализа свойств пересечений геометрических элементов с изображениями бы­ ло установлено, какие геометрические признаки изображения можно извлечь при том или ином способе сканирования и в какой форме от­ ражается упоминавшаяся «двумерность» распознаваемого изображения через формулы, связывающие признаки. В этом и заключается прак­ тическая ценность приведенных в главах 2 и 3 формул. Чем больше удается получить таких формул, тем сильнее выявляется связь между признаками, полнее учитывается «двумерность» изображения, легче достигается гибкость и надежность распознавания проектировщиком распознающего устройства.

Итак, информативность сканирования проанализирована в главах 2 и 3; в этом параграфе приводятся некоторые соображения о влиянии формы развертки на точность, сохранность окрестности и временные характеристики развертки.

Как было установлено, сканирование случайными отрезками пря­ мой оказывается информативнее, чем сканирование случайными лини­ ями, которое давало возможность извлечь информацию в основном о площади, периметре и кривизне объекта. При сканировании случай­ ными линиями единственный признак (интеграл I i от отрицательной степени хорд) чувствителен к углам (/_i является сходящимся при отсутствии углов и расходящимся, если они есть на изображении объ­ екта). Он может служить индикатором наличия углов на изображении1

1 Сергеев В.В. Обработка изображений с использованием развертки

Гильберта-Пеано // Автометрия. — 1984. — №2. — С. 31.

4.1. Замечания о форме траектории сканирования

95

объекта. Сканирование отрезками линий со случайными параметрами дает возможность измерять углы у объектов.

С точки зрения точности 1 определения признаков разные формы траекторий сканирования также оказываются неравноценными. Рас­ сматривая задачу Бюффона об иголках, мы отмечали, что такая же вероятность пересечения получается, если бросать не иголку, т. е. направленный отрезок линии, а кривую, представляющую собой скру­ ченный отрезок такой же длины. Однако при определенной форме кривой, например, если бросать двухзвенную ломаную линию дли­ ной I с прямым углом между звеньями, результат будет намного точнее.

Для того чтобы убедиться в этом, вернемся вновь к задаче Бюффо­ на [17, 43, 105] и рассмотрим случай, когда иголку единичной длины случайным образом бросают на решетку параллельных линий, рас­ стояние между которыми столь мало, что подсчет числа пересечений эквивалентен измерению длины проекции иголки в направлении линий решетки. Итак, мы наблюдаем случайную величину X = |sin#|, где угол в распределен равномерно на интервале ( 0 , 27г). Тогда X является несмещенной оценкой для 27г-1 с коэффициентом вариации <jXfM.X =

=^/(1/8)тг2 - 1 = 0,4834.

Встохастической геометрии наряду со случайной величиной ф, используемой в качестве оценки в методе Монте-Карло, рассматри­ вается так называемая «антитетическая» переменная ф1, которая явля­ ется зависящей от ф случайной величиной с тем же математическим ожиданием, однако изменяющейся в противоположном направлении— когда ф мало, ф' велика, и наоборот. Складывая ф и ф', можно надеяться на значительное улучшение оценки. Этот принцип работает,

когда мы рассматриваем ломаную линию, состоящую из двух взаимно перпендикулярных отрезков, в качестве траектории при случайном ска­ нировании объекта в виде упомянутой решетки часто расположенных параллельных линий.

В

этом случае

несмещенная оценка

для 2-7г~1

составит

X ' =

-(|sin0| + |c°s0|),

а коэффициент

вариации X '

будет

Y/(1/16)7T2 + (1/8)7г —1 = 0,0977. Поэтому при сканировании такой ломаной по сравнению со сканированием случайными отрезками эффективность возрастает в 24,4 раза.

В плане развития этой идеи можно использовать для случайного сканирования п иголок в форме звезды с углами тт~1между иголкамилучами. При этом коэффициент вариации будет еще меньше и составит

7г2(12п2\/5) 1[1 + о(п~2)].1

1 Вероятностному анализу точности выделения признаков в зависимости от числа шагов сканирующей системы и подходу на этой основе к оценке надежности распознавания посвящен следующий параграф; здесь же лишь приводится замечание по частному вопросу о влиянии на точность формы траектории сканирования.

98 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

как для достижения инвариантности распознавания по отношению к группе движения мы обеспечиваем абсолютную равномерность распре­ деления траекторий сканирования по сетчатке.

Некоторые важные преимущества по сравнению с детерминирован­ ными имеют рассмотренные в книге случайные развертки. Это обуслов­ лено характером связи надежности распознавания и быстродействия, привносимого ими в работу распознающей системы. Для уяснения этих преимуществ рассмотрим следующий пример. Предположим, что для распознавания предъявлены объекты, являющиеся конечными мно­ жествами случайных точек, причем объекты, относящиеся к разным образам, отличаются лишь единственным признаком — числом точек — независимо от их расположения. Распознавание, таким образом, сво­ дится к подсчету числа точек, при этом время и место их появления на сетчатке распознающей системы случайны.

С целью упрощения предположим, что сетчатка представляет собой квадратную матрицу N х N и точка является элементом этой матрицы. Для подсчета точек в множестве необходимо фиксировать случаи пере­ сечения каждой точки с разверткой. Сканирование матрицы случайной разверткой, т. е. случайный поэлементный просмотр ее, можно рассмат­ ривать как серию независимых испытаний из п независимых проверок элементов матрицы. Эта процедура описывается биномиальным зако­ ном распределения. При малых значениях вероятности пересечения q биномиальный закон описывается формулой Пуассона

Р„(то) nq

Это вероятность m-кратного пересечения со случайной разверткой при «испытаниях, т. е. при п шагах развертки.

При таком законе распределения зависимость вероятности одного пересечения с разверткой от времени сканирования Т имеет вид Р =

= 1 — е~аТ. Величина \/а имеет смысл среднего времени Т скани­ рования до момента пересечения точки с разверткой 1/а = т/ц, где т — коэффициент пропорциональности, равный времени, затрачивае­ мому на один эксперимент или на осмотр разверткой одного элемента матрицы: т = T / N 2.

Следует подчеркнуть, что при случайном сканировании вероятность одного пересечения уменьшается медленнее, чем время до момента пересечения, ибо они связаны зависимостью Р = 1 —е~аТ. Предпо­ ложим, например, что а = 1 (мкс)-1, тогда при Т = 1 мкс вероятность Р = 0,63, а при Т = 0,5 мкс вероятность Р = 0,39. Итак, для случай­ ного сканирования при уменьшении времени сканирования на 50% вероятность уменьшается на 38%, в то время как при детермини­ рованной развертке уменьшение времени сканирования на 50% на столько же уменьшает вероятность. Это очень важное свойство; оно показывает, что распознающая система со случайным сканированием может быть эффективнее по критерию «надежность распознавания — быстродействие», чем система с детерминированным сканированием.

4.2. Оценка точности определения признаков

99

4.2. Оценка точности определения признаков при стохастическом распознавании

Одним из центральных вопросов стохастического распознавания является установление связи между точностью определения признаков и необходимым для достижения этой точности числом шагов скани­ рующей системы. Знание этой зависимости позволяет получить важ­ нейшие характеристики распознающих алгоритмов и систем, такие как надежность распознавания путем вычисления вероятности ошибочного распознавания, быстродействие или производительность распознающих систем по необходимому числу шагов сканирующей системы.

Отправным пунктом для получения оценки точности является опре­ деление дисперсии числа пересечений изображений с линиями разверт­ ки, поскольку число пересечений является критерием распознавания. Пусть для определенности анализируется стохастический алгоритм распознавания, реализованный в системе, рассмотренной в § 2.2. Он основан на связи числа пересечений случайных линий длиной L с контуром изображения, которая задается формулой

п dG = 2L.

(4.1)

Эта формула приобретает вероятностный смысл, когда рассматри­ вается кривая Г длины L, помещенная внутри некоторой области Ф периметром Ьф.

Введя характеристическую функцию от прямой

если G пересекает Ф;

(4.2)

<5#

 

в противном случае,

 

основываясь на (4.1), можно записать

 

 

<WG) dG

2 Ьф '

(4.3)

1 ЬФ

 

Интеграл, стоящий в левой части этого равенства, есть среднее число пересечений Мп кривой Г со случайной прямой, имеющей

вероятностное распределение с плотностью <5ф((?) dGL~^}.

Несмотря на то, что результаты (4.1) и (4.3), составляющие со­ держание теоремы Крофтона, имеют значительную историю и наряду с теоремой Бюффона лежат в основании стохастической геометрии, исследование распределения числа пересечений предпринято лишь в настоящее время.

В [2] с помощью метода инвариантных вложений, истоки кото­ рого лежат в математической физике, найдено распределение числа пересечений и получены моменты первого и второго порядков. Этот метод состоит в том, что задача пересечения кривой со случайными прямыми рассматривается как предельная для аналогичной задачи, поставленной для подходящих случайных окружностей, когда радиус

7*

100 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания

окружностей стремится к бесконечности. Аналогичный подход приме­ нялся в главе 2 при определении оценок линейного пуассоновского процесса. Найденное в [2] на основе этого метода математическое ожидание числа пересечений М.п = 2 Ь / Ь ф совпадает с (4.1); важная для вв1числителвнв1х приложений и для техники дисперсия

D n = 8('qT

r ) + 4 - ^ ( M

m + l ) - 4 - | ,

(4.4)

Ь ф

L ф

Ь ф

 

где q и г — суммарные длинв1 отрезков на двойных касательных между точками касания для случаев, когда кривая Г лежит возле точек касания соответственно по одну либо по разные стороны от самой двойной касательной. Фиксировать такие случаи двойного касания и измерять г и q в системе, рассмотренной в §2.2 сложно, но возможно упрощение оценки (4.4). Как показано в [2], при оценке дисперсии можно пренебречь первым членом в выражении (4.4) для случаев, когда кривая Г есть объединение некоторого числа дуг окружностей. В результате

Т

Т 2

(4.4а)

Dn < 4 - —(Mm + 1) —4 —— .

 

L ф

 

Однако и здесь фигурирует случайная

величина т ,

которая не опре­

делена в алгоритме, реализующем распознавание на основе теоремы Крофтона; Mm = ^ ktk, где tk — вероятность к пересечений кривой Г со случайной касательной к ней Т, такой, что точка касания с кривой Г распределена равномерно по ее длине. Итак, при получении оценки таким способом не удается избежать вспомогательных построений. Поскольку для распознающей системы построение таких касательных сложно, в нашем случае применить эти оценки не представляется возможным.

Как отмечалось, других оценок дисперсии числа пересечений, по данным литературы, в геометрии нет, ибо интерес к ним возник недавно в связи с вычислительными и техническими приложениями. Несколько примыкают к нашей задаче исследования Штейнгауза для измерения длины кривой, наблюдаемой под микроскопом. Он применял теорему Коши о проекциях [17, 101].

Согласно этой теореме, если проецировать кривую в направлении, образующем угол р с осью х, и усреднить проекцию Lv , считая р случайной величиной, принимающей значения от 0 до 7г, то среднее

значение проекции

_ 1

2L

L|cos p\dp

(4.5)

ж

о

Итак, среднее значение длины проекции кривой равно произве­ дению (2/ 7г) и ее длины. Допустим, кривая Г имеет длину L и ее проекция в направлении р измеряется так, что каждый подинтеграл проекции подсчитывается столько раз, сколько точек на кривой про­ ецируется на него. Например, в случае, представленном на рис. 4.3,