книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа
..pdf3.5. Признаки — параметры трещин в материалах |
91 |
На множестве прямых линий G, как показал Пуанкаре, единствен ным инвариантным дифференциальным элементом, на основе которо
го строится |
инвариантная или |
кинематическая мера p(G), является |
dp Add (см. |
§1.2). При этом |
прямая линия задается нормальными |
координатами — полярными координатами точки пересечения прямой с перпендикуляром, опущенным на нее из начала координат (р, в).
Множество прямых интересует нас потому, что в основе предложен ного метода измерения лежит анализ точек пересечения изображения трещины со случайным множеством отрезков прямых линий дискрет ных оптических фильтров, играющих роль случайной входной сетчатки системы [42] (см. приложение В).
Алгоритм измерения параметров трещины осуществляется при та ком подходе путем вычисления средневзвешенной меры всех линий
фильтра, которые пересекают изображение трещины: |
|
пр(р,в) dp A dd, |
(3.31) |
ф
где пр (р,в) обозначает число пересечений линий фильтра (р, в) с изоб ражением трещины F, расположенной в области Ф входной сетчатки измерительного устройства (в данном случае проецируемого на экран телевизионной передающей электронно-лучевой трубки — мишень видекона).
Ограничение области интегрирования размерами экрана А поз воляет провести нормирование кинематической меры и осуществить переход к вероятностным мерам, а, следовательно, к вычислению гео метрических вероятностей.
Пусть Сф является подмножеством тех элементов G, которые про ецируют на экран Ф. Для подмножества прямых Gp, пересекающих F, вероятностная мера
P{F) = |
2 . |
( 3 . 3 2 ) |
|
Р[Стф) |
|
Функция Р (Р ) определена на таком же числе объектов, что и p(F), и является вероятностной мерой.
Если F — изображение некоторой трещины общей длиной До и площадью SQ, спроецированное на круглый экран радиусом R, то на основе вычисления (3.31) и (3.32) и с учетом (2.37) и (2.38) можно оценить вероятности пересечения F с линиями фильтра длиной I (на оптической проекции):
_ 21Ьр
(3.33)
1“ 7Г2Д2 + 2тгRI ’
а с учетом толщины трещины
TYSQ+ ILo
(3.34)
2 “ тгД2 + 2irR '
Как видно из приведенного примера, вероятности Pi и Рг содер жат информацию о длине трещины и ее площади. Следовательно,
92 Гл. 3. Геометрические решётки и признаки распознавания
геометрические вероятности подобного вида могут быть использованы в качестве оценок параметров трещин при испытании.
Таким образом, предлагаемый алгоритм измерения является раз новидностью метода Монте-Карло и предполагает определение доста точно большого числа пересечений изображений с линиями филь тра. Вычисление оценок геометрических вероятностей вида Р\, Р2 , ...
производится с дисперсией Р*(1 —Pi)N~l, где N — число линий фильтра. Оптимальное число N, определенное из условий достаточной точности измерения и простоты выполнения фильтра, равно 103. При таком N верхняя оценка дисперсии равна 0,2510_3. Среднеквадрати ческое отклонение, или точностной допуск метода измерений, состав
ляет 1,6 • 10-2 .
Следует отметить, что примененная система оптической дискрети зации изображения до его сканирования дает возможность нейтрали зовать основные факторы, вносящие погрешность при телевизионных измерениях, а именно нелинейность развертки, геометрические иска жения и изменение размеров растра. Благодаря применению фильтра воздействие этих факторов скажется лишь на изменении частоты и фазы следования получаемых видеоимпульсов, а не их числа и дли тельности, которые определяют размер трещины. Причем, поскольку трещина - объект нестационарный, регулярные штрихи на фильтре давали бы большую вероятность ошибки по сравнению со случайными, ибо в ряде случаев направление роста трещины совпадало бы с распо ложением непрозрачных участков на фильтре. Экспериментально опре деленная точность измерений параметров трещины составила 1,5% (при N = 103), что достаточно для целей решаемой задачи.
ГЛАВА 4
НЕКОТОРЫЕ ОЦЕНКИ АЛГОРИТМОВ СТОХАСТИЧЕСКОГО РАСПОЗНАВАНИЯ
4.1. Замечания о форме траектории сканирования
Круг смежных задач, возникающих при распознавании сложных изображений, необычайно широк: уменьшение зашумленности и филь трация, выделение признаков, эффективное кодирование [4, 33]. Кроме распознавания образов аналогичные задачи возникают и при анализе изображений в различных областях техники, при передаче изображе ний по линиям связи. Для решения этих задач, как правило, необ ходим этап преобразования двумерного информационного массива в одномерный. Это связано с тем, что используются методы, хорошо развитые в технике связи для обработки одномерных временных сиг налов, а также с последовательным принципом действия современных компьютеров, линейной адресацией их памяти. Для преобразования многомерного сигнала-изображения в одномерный используется скани рование, причем, как правило, построчное или постолбцовое. Такое сканирование обусловлено, видимо, историей развития техники — на этапе создания электронных сканирующих систем приемлемым для технической реализации оказался генератор линейно изменяющегося напряжения, основанный на разряде конденсатора и обеспечивающий построчную развертку. Кроме того, некоторые традиции из других сфер человеческой практики — построчная письменность, кни гопечатание — привели к практически полному преобладанию в системах обработки изображений построчной или телевизионной развертки.
Вместе с тем существуют иные виды разверток, позволяющие с меньшими потерями отобразить окрестность каждой точки изображе ния в одномерном массиве [4, 5]. Современная технология, а также эле ментная база (интегральные схемы, микропроцессоры) позволяют без особых затруднений реализовать любой сложный вид сканирования. О перспективности таких сложных разверток свидетельствуют и ан тропоморфные характеристики процесса распознавания. Как показали исследования, при распознавании сложных изображений человеческий взгляд перемещается по сложной траектории со случайными парамет рами [6, 7].
94 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания
Как отмечает известный специалист В. В. Сергеев, с позиций про блемы распознавания образов простейшие способы построчной разверт ки, производимой с целью последующей обработки одномерных мас сивов данных, «оказываются недостаточно эффективными, так как не всегда учитывают характерные особенности изображений как объектов обработки: двумерный характер статистических связей, наличие конту ров, однородных областей и т. д. Учет указанной специфики позволяет повысить качество обработки, но приводит к усложнению соответ ствующих алгоритмов. Развитие алгоритмов обработки изображений в основном и идет по пути совершенствования способов использо вания “двумерности” обрабатываемых данных, не сопровождающихся чрезмерным ростом реализационной сложности» 1. Одна из основных идей, развиваемых в книге, заключается в том, что предлагается учесть особенности изображения не на этапе обработки данных, а раньше — на этапе сканирования изображений, когда эти данные только формируются.
Многочисленные формулы, приведенные в главе 2 для различных траекторий сканирования, и есть средство отображения такой «дву мерности», т. е. статистической связи между точками изображения, которая проявляется через геометрию образов. В этом особенность развиваемого в книге подхода.
В главе 2 рассматривались и исследовались различные виды ска нирования с точки зрения их информативности. На основе анализа свойств пересечений геометрических элементов с изображениями бы ло установлено, какие геометрические признаки изображения можно извлечь при том или ином способе сканирования и в какой форме от ражается упоминавшаяся «двумерность» распознаваемого изображения через формулы, связывающие признаки. В этом и заключается прак тическая ценность приведенных в главах 2 и 3 формул. Чем больше удается получить таких формул, тем сильнее выявляется связь между признаками, полнее учитывается «двумерность» изображения, легче достигается гибкость и надежность распознавания проектировщиком распознающего устройства.
Итак, информативность сканирования проанализирована в главах 2 и 3; в этом параграфе приводятся некоторые соображения о влиянии формы развертки на точность, сохранность окрестности и временные характеристики развертки.
Как было установлено, сканирование случайными отрезками пря мой оказывается информативнее, чем сканирование случайными лини ями, которое давало возможность извлечь информацию в основном о площади, периметре и кривизне объекта. При сканировании случай ными линиями единственный признак (интеграл I i от отрицательной степени хорд) чувствителен к углам (/_i является сходящимся при отсутствии углов и расходящимся, если они есть на изображении объ екта). Он может служить индикатором наличия углов на изображении1
1 Сергеев В.В. Обработка изображений с использованием развертки
Гильберта-Пеано // Автометрия. — 1984. — №2. — С. 31.
4.1. Замечания о форме траектории сканирования |
95 |
объекта. Сканирование отрезками линий со случайными параметрами дает возможность измерять углы у объектов.
С точки зрения точности 1 определения признаков разные формы траекторий сканирования также оказываются неравноценными. Рас сматривая задачу Бюффона об иголках, мы отмечали, что такая же вероятность пересечения получается, если бросать не иголку, т. е. направленный отрезок линии, а кривую, представляющую собой скру ченный отрезок такой же длины. Однако при определенной форме кривой, например, если бросать двухзвенную ломаную линию дли ной I с прямым углом между звеньями, результат будет намного точнее.
Для того чтобы убедиться в этом, вернемся вновь к задаче Бюффо на [17, 43, 105] и рассмотрим случай, когда иголку единичной длины случайным образом бросают на решетку параллельных линий, рас стояние между которыми столь мало, что подсчет числа пересечений эквивалентен измерению длины проекции иголки в направлении линий решетки. Итак, мы наблюдаем случайную величину X = |sin#|, где угол в распределен равномерно на интервале ( 0 , 27г). Тогда X является несмещенной оценкой для 27г-1 с коэффициентом вариации <jXfM.X =
=^/(1/8)тг2 - 1 = 0,4834.
Встохастической геометрии наряду со случайной величиной ф, используемой в качестве оценки в методе Монте-Карло, рассматри вается так называемая «антитетическая» переменная ф1, которая явля ется зависящей от ф случайной величиной с тем же математическим ожиданием, однако изменяющейся в противоположном направлении— когда ф мало, ф' велика, и наоборот. Складывая ф и ф', можно надеяться на значительное улучшение оценки. Этот принцип работает,
когда мы рассматриваем ломаную линию, состоящую из двух взаимно перпендикулярных отрезков, в качестве траектории при случайном ска нировании объекта в виде упомянутой решетки часто расположенных параллельных линий.
В |
этом случае |
несмещенная оценка |
для 2-7г~1 |
составит |
X ' = |
-(|sin0| + |c°s0|), |
а коэффициент |
вариации X ' |
будет |
Y/(1/16)7T2 + (1/8)7г —1 = 0,0977. Поэтому при сканировании такой ломаной по сравнению со сканированием случайными отрезками эффективность возрастает в 24,4 раза.
В плане развития этой идеи можно использовать для случайного сканирования п иголок в форме звезды с углами тт~1между иголкамилучами. При этом коэффициент вариации будет еще меньше и составит
7г2(12п2\/5) 1[1 + о(п~2)].1
1 Вероятностному анализу точности выделения признаков в зависимости от числа шагов сканирующей системы и подходу на этой основе к оценке надежности распознавания посвящен следующий параграф; здесь же лишь приводится замечание по частному вопросу о влиянии на точность формы траектории сканирования.
98 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания
как для достижения инвариантности распознавания по отношению к группе движения мы обеспечиваем абсолютную равномерность распре деления траекторий сканирования по сетчатке.
Некоторые важные преимущества по сравнению с детерминирован ными имеют рассмотренные в книге случайные развертки. Это обуслов лено характером связи надежности распознавания и быстродействия, привносимого ими в работу распознающей системы. Для уяснения этих преимуществ рассмотрим следующий пример. Предположим, что для распознавания предъявлены объекты, являющиеся конечными мно жествами случайных точек, причем объекты, относящиеся к разным образам, отличаются лишь единственным признаком — числом точек — независимо от их расположения. Распознавание, таким образом, сво дится к подсчету числа точек, при этом время и место их появления на сетчатке распознающей системы случайны.
С целью упрощения предположим, что сетчатка представляет собой квадратную матрицу N х N и точка является элементом этой матрицы. Для подсчета точек в множестве необходимо фиксировать случаи пере сечения каждой точки с разверткой. Сканирование матрицы случайной разверткой, т. е. случайный поэлементный просмотр ее, можно рассмат ривать как серию независимых испытаний из п независимых проверок элементов матрицы. Эта процедура описывается биномиальным зако ном распределения. При малых значениях вероятности пересечения q биномиальный закон описывается формулой Пуассона
Р„(то) nq
Это вероятность m-кратного пересечения со случайной разверткой при «испытаниях, т. е. при п шагах развертки.
При таком законе распределения зависимость вероятности одного пересечения с разверткой от времени сканирования Т имеет вид Р =
= 1 — е~аТ. Величина \/а имеет смысл среднего времени Т скани рования до момента пересечения точки с разверткой 1/а = т/ц, где т — коэффициент пропорциональности, равный времени, затрачивае мому на один эксперимент или на осмотр разверткой одного элемента матрицы: т = T / N 2.
Следует подчеркнуть, что при случайном сканировании вероятность одного пересечения уменьшается медленнее, чем время до момента пересечения, ибо они связаны зависимостью Р = 1 —е~аТ. Предпо ложим, например, что а = 1 (мкс)-1, тогда при Т = 1 мкс вероятность Р = 0,63, а при Т = 0,5 мкс вероятность Р = 0,39. Итак, для случай ного сканирования при уменьшении времени сканирования на 50% вероятность уменьшается на 38%, в то время как при детермини рованной развертке уменьшение времени сканирования на 50% на столько же уменьшает вероятность. Это очень важное свойство; оно показывает, что распознающая система со случайным сканированием может быть эффективнее по критерию «надежность распознавания — быстродействие», чем система с детерминированным сканированием.
4.2. Оценка точности определения признаков |
99 |
4.2. Оценка точности определения признаков при стохастическом распознавании
Одним из центральных вопросов стохастического распознавания является установление связи между точностью определения признаков и необходимым для достижения этой точности числом шагов скани рующей системы. Знание этой зависимости позволяет получить важ нейшие характеристики распознающих алгоритмов и систем, такие как надежность распознавания путем вычисления вероятности ошибочного распознавания, быстродействие или производительность распознающих систем по необходимому числу шагов сканирующей системы.
Отправным пунктом для получения оценки точности является опре деление дисперсии числа пересечений изображений с линиями разверт ки, поскольку число пересечений является критерием распознавания. Пусть для определенности анализируется стохастический алгоритм распознавания, реализованный в системе, рассмотренной в § 2.2. Он основан на связи числа пересечений случайных линий длиной L с контуром изображения, которая задается формулой
п dG = 2L. |
(4.1) |
Эта формула приобретает вероятностный смысл, когда рассматри вается кривая Г длины L, помещенная внутри некоторой области Ф периметром Ьф.
Введя характеристическую функцию от прямой
если G пересекает Ф; |
(4.2) |
||
<5# |
|
||
в противном случае, |
|
||
основываясь на (4.1), можно записать |
|
|
|
<WG) dG |
2 Ьф ' |
(4.3) |
|
1 ЬФ |
|||
|
Интеграл, стоящий в левой части этого равенства, есть среднее число пересечений Мп кривой Г со случайной прямой, имеющей
вероятностное распределение с плотностью <5ф((?) dGL~^}.
Несмотря на то, что результаты (4.1) и (4.3), составляющие со держание теоремы Крофтона, имеют значительную историю и наряду с теоремой Бюффона лежат в основании стохастической геометрии, исследование распределения числа пересечений предпринято лишь в настоящее время.
В [2] с помощью метода инвариантных вложений, истоки кото рого лежат в математической физике, найдено распределение числа пересечений и получены моменты первого и второго порядков. Этот метод состоит в том, что задача пересечения кривой со случайными прямыми рассматривается как предельная для аналогичной задачи, поставленной для подходящих случайных окружностей, когда радиус
7*
100 Гл. 4. Некоторые оценки алгоритмов стохастического распознавания
окружностей стремится к бесконечности. Аналогичный подход приме нялся в главе 2 при определении оценок линейного пуассоновского процесса. Найденное в [2] на основе этого метода математическое ожидание числа пересечений М.п = 2 Ь / Ь ф совпадает с (4.1); важная для вв1числителвнв1х приложений и для техники дисперсия
D n = 8('qT |
r ) + 4 - ^ ( M |
m + l ) - 4 - | , |
(4.4) |
Ь ф |
L ф |
Ь ф |
|
где q и г — суммарные длинв1 отрезков на двойных касательных между точками касания для случаев, когда кривая Г лежит возле точек касания соответственно по одну либо по разные стороны от самой двойной касательной. Фиксировать такие случаи двойного касания и измерять г и q в системе, рассмотренной в §2.2 сложно, но возможно упрощение оценки (4.4). Как показано в [2], при оценке дисперсии можно пренебречь первым членом в выражении (4.4) для случаев, когда кривая Г есть объединение некоторого числа дуг окружностей. В результате
Т |
Т 2 |
(4.4а) |
Dn < 4 - —(Mm + 1) —4 —— . |
||
|
L ф |
|
Однако и здесь фигурирует случайная |
величина т , |
которая не опре |
делена в алгоритме, реализующем распознавание на основе теоремы Крофтона; Mm = ^ ktk, где tk — вероятность к пересечений кривой Г со случайной касательной к ней Т, такой, что точка касания с кривой Г распределена равномерно по ее длине. Итак, при получении оценки таким способом не удается избежать вспомогательных построений. Поскольку для распознающей системы построение таких касательных сложно, в нашем случае применить эти оценки не представляется возможным.
Как отмечалось, других оценок дисперсии числа пересечений, по данным литературы, в геометрии нет, ибо интерес к ним возник недавно в связи с вычислительными и техническими приложениями. Несколько примыкают к нашей задаче исследования Штейнгауза для измерения длины кривой, наблюдаемой под микроскопом. Он применял теорему Коши о проекциях [17, 101].
Согласно этой теореме, если проецировать кривую в направлении, образующем угол р с осью х, и усреднить проекцию Lv , считая р случайной величиной, принимающей значения от 0 до 7г, то среднее
значение проекции
2ж
_ 1 |
2L |
L|cos p\dp |
(4.5) |
2ж |
ж |
о
Итак, среднее значение длины проекции кривой равно произве дению (2/ 7г) и ее длины. Допустим, кривая Г имеет длину L и ее проекция в направлении р измеряется так, что каждый подинтеграл проекции подсчитывается столько раз, сколько точек на кривой про ецируется на него. Например, в случае, представленном на рис. 4.3,