Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

10.4. Триплетные признаки в ультразвуковых исследованиях

2 2 1

качестве исходных данных в этом алгоритме используется семейство порождающих множеств { К } решётки L f и ещё, может быть, мно­ жество S = U К , расширяющее (доопределяющее) семейство { К } .

к е { к }

Исходные и результирующие данные алгоритма удовлетворяют услови­ ям {К} С 2s , |{А'}| = то < 21s !, е Lf) -фф- = f ) К а )- Обоснование алгоритма и оценка его трудоемкости приводятся в работе [115]. Алго­ ритм является сходящимся и строит решетку, общее число элементов

в которой не превышает величины

< |5| или величины min{2m,2"} при п = 151, где т = \{К}\, п = = max \К\, { К } семейство порождающих множеств решётки L f

ке { к }

иS = [J К [115]. В практических задачах анализа ассоциаций обычно

выполняются условия то

те и п < |5|, тогда трудоемкость алгоритма

построения решетки Lf

определяется величиной О

, кото­

рая уменьшается при учете ограничений на мощность элементарных классификаторов.

Таким образом, применение методов стохастической геометрии и методов КУМ для решения задачи распознавания гистологических изображений позволяет повысить эффективность ранней диагности­ ки онкологических заболеваний. В частности, рассмотренный метод дискретной классификации описаний изображений позволяет повысить эффективность решения задач за счет использования введенных отно­ шений частичного упорядочения на множестве элементарных класси­ фикаторов. Метод дает адекватную модель структуры данных и поз­ воляет использовать достаточно развитый аппарат теории решеток для аналитического исследования свойств элементарных классификаторов. Метод представляет модель в достаточно компактном и наглядном виде.

10.4. Экстракция триплетных признаков ультразвуковых исследований

Предварительная обработка ультразвуковых исследований изображений. Ультразвуковые исследования являются базовым методом диагностики заболеваний щитовидной железы. Автоматизация этого процесса сталкивается с объективными трудностями, для преодоления которых разработана процедура предварительной обработки, предшествующая распознаванию [64, 95].

Рассмотрим два основных этапа обработки ультразвуковых снимков:

сегментация области щитовидной железы на УЗИ снимках;

выделение очаговых образований на области щитовидной же­

лезы.

10.4. Триплетные признаки в ультразвуковых исследованиях

223

На рис. 10.5, а дано исходное изображение.

Как видно из рисунка 10.5,6, выделенное подмножество представ­ ляет собой окружающую среду щитовидной железы и не представляет интереса для исследования. Второе подмножество (рис. 10.1, в, см. цветную вклейку) представляет собой непосредственно щитовидную железу, также есть еще несколько подмножеств, представляющих со­ бой некоторый шум (рис. 10.1, г, см. цветную вклейку), которые могут быть как частью окружающей среды, так и частью самой железы. Из результата видно, что выбранный оптимальный диаметр подмножеств является достаточно малым для относительно точного выделения близ­ кого к черному цвета окружающей среды, но недостаточно большим для точного выделения всей щитовидной железы.

Данное заключение позволяет сделать вывод, что для повышения информативности результата анализ снимка следует проводить в нес­ колько шагов. Высокая скорость работы алгоритма позволяет исполь­ зовать его несколько раз подряд для решения одной задачи.

Одним из подходов является проведение после каждого шага рабо­ ты алгоритма двух операций, назовем их «исключением несвязностей» и «рекурсией».

Первая операция — исключение несвязностей — заключается в следующем. После обработки снимка мы получаем набор подмножеств точек, в большинстве случаев представляющих собой несвязные об­ ласти. Вследствие этого в случаях, когда щитовидная железа имеет внутри себя некоторые образования, изображенные на снимке цве­ том, близким к черному, т. е. к цвету окружающей среды, данные образования будут относиться к подмножеству окружающей среды. Но данные образования представляют интерес для исследования, и исключение несвязностей позволит объединить их с изображением щитовидной железы. Также некоторые элементы снимка, выделенные в отдельный объект — подмножество, но не являющиеся таковым, могут объединиться с некоторым классом и этим понизить количество шумов.

Исключение несвязностей предполагается производить следующим образом:

каждую связную область выделенного множества представить в виде его подмножества;

сравнить процентную составляющую площади каждого подмно­ жества от площади всего снимка, и если она превышает наперед заданное значение, то данное подмножество можно считать отдельным объектом. В противном случае это подмножество следует объединить

собъектом, окружающим его.

В результате мы получим разбиение снимка на подмножества, представляющие собой связные области, после чего можно приступать к рекурсии.

Рекурсия представляет собой:

— удаление из исходного снимка самого четкого подмножества, не являющегося щитовидной железой;

228 Гл. 10. Распознавание сложноструктурированных изображений

стве функционала 0 выберем среднее арифметическое. Полученный числовой признак будет представлять собой числовую оценку неров­ ности границы объекта. Ровную границу очага будут характеризовать значения признака, близкие к единице; неровную — значения, суще­ ственно большие единицы.

Описанный подход был протестирован на наборе ультразвуковых изображений для 70 различных пациентов, полученных методом «сво­ бодной руки».

10.5. Применение параллельных вычислений при решении задач распознавания на основе

стохастической геометрии и функционального анализа

На современном этапе производители процессоров столкнулись с технологическими сложностями дальнейшего наращивания тактовой частоты. В качестве альтернативного способа увеличения производи­ тельности в сегменте персональных компьютеров появились многоядер­ ные процессоры. На сегодняшний день уже существуют двух- и четырехядерные модели, аналитики прогнозируют дальнейшее увеличение количества ядер.

Появление многоядерных процессоров, в первую очередь, отрази­ лось на производителях программного обеспечения. Теперь производи­ тельность программы определяется не только эффективностью алго­ ритма, но и эффективным использованием параллельных вычислений, применение которых позволяет полностью использовать вычислитель­ ные ресурсы системы.

Далеко не все алгоритмы допускают эффективное распараллелива­ ние. Разработчикам программ с большой вычислительной сложностью необходимо либо искать новые алгоритмы решения задач, либо распа­ раллеливать существующие вычислительные схемы.

Рассмотрим возможность применения параллельных вычислений в задачах распознавания образов методом стохастической геометрии. Ориентируясь на современные аппаратные средства, необходимо по­ строить нераспределенную систему распознавания образов, порожда­ ющую не менее четырёх эффективных потоков (что соответствует наибольшему числу ядер на сегодняшний день).

Переход от однопоточной системы к параллельной обычно сводится к применению многопоточных вычислений в наиболее ресурсоемких операциях. Такой подход вытекает из требований, предъявляемых к многопоточным вычислениям:

• минимальные расходы вычислительных ресурсов на управление потоками (другими словами, затраты машинных ресурсов на порожде­ ние, удаление и переключение между потоками должны быть мини­ мальными);

• минимизация времени ожидания потока (синхронизация потоков приостанавливает их выполнение);

230Гл. 10. Распознавание сложноструктурированных изображений

конвейерное вычисление (в результате работы одного потока фор­ мируются исходные данные для другого потока),

смешанная схема (применяется только при очень большом коли­ честве потоков).

Для нашей задачи больше всего подходит первая схема, так как она обычно проще в реализации и не приводит к длительной приостановке выполнения потоков при синхронизации.

Необходимо отметить, что возможно организовать параллельное вычисление всего дерева функционалов, но данный подход будет неэф­ фективен при наличии всего одного Т функционала и приведет к увеличению необходимого количества оперативной памяти приблизи­ тельно на 40%, что неприемлемо для больших изображений. Поэтому в дальнейшем рассматривается только возможность применения па­ раллельных вычислений в рамках одной операции, не приводящего к значительному увеличению необходимого количества памяти.

Для реализации вычислений в параллельных потоках необходимо разделить обрабатываемые исходные данные на равные части, коли­ чество частей определит количество эффективных потоков. В задачах распознавания образов на основе стохастической геометрии и функци­ онального анализа сканирующие прямые формируются для множества углов (оно определяется настройками системы и обычно составляет 0°-360° с шагом 10°). Множество сканирующих прямых, найденных для определенного угла, является исходным для потока, вычисляющего значение Т функционала.

Далее необходимо осуществить эффективное управление потоками. Количество порождаемых потоков не должно быть жестко детерми­

нированным, так как это приведет к ухудшению производительности в случае несовпадения количества процессоров с количеством порож­ денных потоков. Все сканирующие прямые хранятся в одном объекте и их количество известно. Легко добавить в данный класс метод, возвращающий множество необработанных сканирующих прямых или null, если все сканирующие прямые переданы на обработку. Получение потоком вместо исходных данных null приведет к его удалению. Ре­ зультаты вычисления передаются объекту класса t_result. Все резуль­ таты вычислений хранят угол, для которого было сформировано данное множество сканирующих прямых, поэтому не составляет сложности отсортировать сформированные данные в классе хранения результата, определить прогресс выполнения вычислений и задать событие окон­ чания вычислений.

Простейшая оболочка для многопоточных вычислений представлена на рис. 10.14.

В результате профилирования новой системы (использовались два потока, на двухядерном процессоре) были получены следующие резуль­ таты:

вычисление Т функционала и 85%, вычисление Р функционала и 15%, вычисление © функционала < 1 %.