Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

10.1. Сложноструктурированные изображения в диагностике

211

цель — найти существенные связи между признаками, выделяемыми на гистологических и ультразвуковых изображениях. В работе участ­ вовали восемь научных групп: из университета Утрехта (Голландия), университета Вюрцбурга (Германия), университета Суррея (Англия), Объединённый институт проблем информатики, Государственный ме­ дицинский университет, Медицинская академия последипломного об­ разования (Белоруссия). От России - две научные группы: Вычисли­ тельного центра РАН им. А. А. Дородницына и Пензенского государ­ ственного университета.

Проект посвящен междисциплинарной информатико-медицинской проблематике, связанной с совершенствованием диагностики заболе­ ваний щитовидной железы как последствия техногенной катастрофы на Чернобыльской АЭС. Согласно данным медицинской статистики, на территориях, подвергшихся воздействию радиоактивного загрязне­ ния вследствие Чернобыльской аварии, за период 1990-1998 гг. было выявлено более 1 500 случаев рака щитовидной железы среди детей и подростков, в то время как за период 1986-1990 гг. было выявлено немногим более 100 случаев. В связи с этим разработка методов ранней диагностики онкологических заболеваний щитовидной железы становится важнейшей социальной задачей.

Основным предметом научного исследования проекта является ана­ лиз ультразвуковых и гистологических изображений. К признакам изображений относятся объём, форма и текстурные признаки уль­ тразвуковых изображений, а также калориметрические признаки и признаки, вычисленные на основе трейс-преобразований, результаты применения методов анализа основных и независимых компонент для гистологических изображений. Следует подчеркнуть, что все признаки анализируются совместно с массой клинических данных, для того, чтобы обнаружить корреляции между ними, ранжировать признаки изображений по их сравнительной важности, определить статисти­ ческую значимость связей между данными и дать оценку диагно­ стическим способностям признаков. Для этого применяются методы анализа основных независимых компонент, критерии статистической значимости, многомерные статистические модели, множественная ли­ нейная регрессия, многомерное шкалирование, иерархическая группи­ ровка, поддерживающие векторные машины, методы случайных лесов, логико-комбинаторные методы и алгебраические подходы к генерации.

Предметом исследований руководимой автором научной группы было формирование признаков на основе трейс-преобразования для анализа и распознавания гистологических изображений и изображе­ ний ультразвуковых исследований. Поскольку эти виды изображений имеют различную природу и масштаб (микро- и макроуровень), их прямое сравнение невозможно. Для выявления связей необходимо ис­ пользовать методы, находящиеся на стыке математики, информатики и медицины. Дело в том, что профессиональные врачи-диагносты используют весьма ограниченное число признаков, имеющих чёткую медицинскую интерпретацию и различимые зрением человека. Исполь­ зование математических методов позволяет расширить «понимание»

14'

212 Гл. 10. Распознавание сложноструктурированных изображений

изображений путём формирования абстрактных числовых признаков. Такие признаки не имеют смысла с точки зрения медицины, но их информативноств может 6 B I T B доказана путём эксперимента.

Для автоматической генерации абстрактных признаков мы исполвзуем аппарат стохастической геометрии и функционального анализа, эффективность которого была подтверждена в [50, 52, 55, 58, 78, 79]. Признаки распознавания в рассматриваемом подходе имеют структуру в виде композиции трёх функционалов. В связи с характерной струк­ турой такие признаки были названы триплетными. Применение проце­ дуры минимизации размерности признакового пространства позволяет отобрать наиболее информативные признаки.

Методы стохастической геометрии также применимы и для экстрак­ ции признаков, имеющих медицинский смысл, если они основаны на геометрии рассматриваемых объектов. Зная геометрические характери­ стики, существенные для вычисления признака, мы можем подобрать чувствительные к ним функционалы.

10.2. Генерация и экстракция признаков распознавания гистологических изображений

Предварительная обработка гистологических изображений.

Изображения гистологических препаратов тканей щитовидной железы представляют собой цветные, многокомпонентные, семантически насыщенные изображения. На них представлены ядра, фолликулы, соединительная ткань и другие виды объектов, каждый из которых имеет свои значимые характеристики. Триплетные признаки хорошо «схватывают» геометрические особенности изображённых объектов, но для этого сначала необходимо выполнить предварительную обработку изображений с целью выделения на них объектов определённого вида.

Гистологические изображения получают под микроскопом при уве­ личениях от 50до 1000-кратного, при этом каждое увеличение дает свою долю диагностической информации. В книге рассматривается предобработка изображений, имеющих 400-кратное увеличение (см. рис. 10.1, а на цветной вклейке).

Основными объектами, выделяемыми на гистологических изобра­ жениях ткани щитовидной железы при данном увеличении, являются ядра и фолликулы. Анализ показал, что для построения автоматизи­ рованной системы диагностики необходимо измерять следующие вели­ чины:

1) площадь ядра, наибольший и наименьший диаметр ядра;

2) ориентацию ядра;

3)расстояние между ядрами;

4)площадь фолликула;

5)кривизну контура ядра;

6) наибольший и наименьший диаметр фолликула;

7) соотношение площадей занимаемых ядрами и фолликулами;

10.2. Генерация и экстракция признаков распознавания

213

8) площадь ядра;

9) наибольший и наименьший диаметр ядра;

10) ориентацию ядра;

1 1 ) расстояние между ядрами;

12) площадь фолликула;

13)кривизну контура ядра;

14)наибольший и наименьший диаметр фолликула;

15)соотношение площадей, занимаемых ядрами и фолликулами.

Выделение ядер. Согласно общепринятой методике, гистологиче­ ские препараты тканей щитовидной железы окрашиваются гематокси­ лином и эозином, в результате чего ядра клеток приобретают темно­ синюю, а цитоплазма и другие элементы препарата — розоватую окраску. Эксперименты показали, что хороший результат достигается при выделении ядер на основе пороговой фильтрации предварительно сглаженного изображения по компонентам цветовой модели L*a*b* (рис. 10.1,6 на цветной вклейке). После этого для повышения связ­ ности выделенных объектов на изображении применяется операция замыкания морфологической геометрии.

На следующем этапе предобработки используется априорная инфор­ мация о диапазоне возможных размеров ядер клеток. Изолированные объекты, площадь которых менее некоторого порога, считаются шумом и удаляются с изображения (рис. 10.1 , в на цветной вклейке).

Ядра раковых клеток часто имеют неоднородный, оптически про­ зрачный вид. Поэтому следующим этапом предобработки является заполнение просветов внутри выделенных объектов (рис. 10.1 , в на цветной вклейке).

Выделение фолликул. Непосредственное выделение фолликул на гистологическом изображении имеет ряд сложностей, связанных с большой вариабельностью их цвета, формы, размеров, наличием пени­ стой цитоплазмы. Поэтому для выделения фолликул, форма, размеры и относительная площадь которых на изображении являются важными характеристиками структуры ткани щитовидной железы, выполняется бинаризация полученного изображения ядер.

Для отсечения областей фиброзной ткани предлагаем применить методы анализа текстуры изображения, так как они позволяют раз­ личать объекты одинакового цвета и формы. Из литературы можно выделить два основных подхода к рассмотрению текстур [26, 106, 107, 114, 118].

1.Интерпретация текстуры как повторения базовых примитивов, имеющих различную ориентацию в пространстве. Сторонники данного подхода ориентировали исследования на спектральный анализ и пред­ ставление текстуры.

2.Текстура рассматривается, как некий анархичный однородный объект, не обладающий ярко выраженными краями. В данном слу­ чае используется вероятностный метод анализа текстуры. Исходное гистологическое изображение представлено на рис. 10.2, а (см. цветную вклейку).

214 Гл. 10. Распознавание сложноструктурированных изображений

Визуально область фиброза характеризуется неравномерным, раз­ мытым цветом с белыми или очень светлыми прожилками. Размер

иформа прожилок различны, как и направления изменения цвета и яркости. Таким изображениям более адекватен второй подход, исполь­ зующий вероятностные методы, так как в подобной текстуре прак­ тически отсутствуют регулярные повторяющиеся примитивы. Среди множества методов получения характеристик текстур вероятностному подходу лучше всего соответствуют описание текстуры длинами серий

ианализ матрицы смежности. Учитывая крайне высокую трудоемкость поиска серий на фрагменте изображения, предлагаем использовать группу методов, основанных на анализе матрицы смежности. Кроме того, анализ матрицы смежности позволяет получить достаточно боль­ шое количество признаков при относительной простоте реализации данного метода [63]. Матрица смежности или матрица совместной встречаемости уровней яркости представляет собой оценку плотности распределения вероятностей второго порядка, полученную по изобра­ жению в предположении, что плотность вероятности зависит только от

расположения двух пикселей.

Матрица смежности строится следующим образом.

1.Выбранный для анализа фрагмент изображения преобразуется из цветного в градации серого.

2.В самом общем случае матрица смежности является 4-мерной

матрицей P(i,j,d,<p), представляющей плотность вероятности наличия двух точек, для которых верно, что г — яркость первой точки, j — яркость второй точки, d — расстояние между ними и угол, соеди­ няющей их прямой. Для упрощения вычислений обычно используют только первые два параметра, т. е. яркости точек.

Для представления серого цвета 256 градациями (8 бит) строится матрица P ( i , j ) размером 256 х 256, где каждая ячейка представляет собой плотность вероятности события: у точки с цветом i соседняя точка будет иметь цвет j. Обычно, для увеличения точности, плот­ ность вероятности рассчитывают, используя среднее сумм плотностей вероятности для различных направлений. Стандартное количество на­ правлений определяется количеством соседних пикселей и обычно принимается равным 4 или 8.

Всего по матрице совместной встречаемости P(i,j) можно постро­ ить более 20 признаков, ниже представлены наиболее эффективные для выделения фиброзной ткани:

• степень однородности или энергия:

 

г,3

• энтропия

Pi,j Log {Pi,j)\

 

i.j

• контраст

К Я 2 ' Р ц :

 

ij•

• обратный момент разности

10.2. Генерация и экстракция признаков распознавания

215

Результат выделения областей фиброза на гистологическом изобра­ жении с использованием перечисленных четырех признаков показан на рис. 10.2,6 (см. цветную вклейку).

К бинаризованному изображению препарата с выделенными обла­ стями фиброзной ткани применяется морфологическая операция выде­ ления связных областей. При этом в одну область объединяются точки, граничащие друг с другом по любому направлению, при условии, что окрестность каждой точки радиусом R не включает ни одной точки, относящейся к изображению ядер либо областей фиброза. На рис. 10.1 , г показано, что выделенные области соответствуют фоллику­ лам на гистологических изображениях.

Таким образом, на полученном в результате предварительной об­ работки трехцветном изображении серым цветом выделены ядра, бе­ лым — фолликулы, черный цвет соответствует фону изображения.

Данное изображение пригодно для дальнейшего выделения призна­ ков распознавания методами стохастической геометрии, причем за один проход сканирующей системы можно получить признаки, описывающие свойства как ядер, так и фолликул.

Описанная методика предварительной обработки была провере­ на соответствующими компьютерными экспериментами. Разработан­ ная система распознавания гистологических и УЗИ-изображений, с помощью которой были получены все иллюстрации данной главы, рассмотрена в § 10.6.

Генерация и экстракция признаков. Мы выделяем два основных подхода к формированию триплетных признаков.

Первый подход использует уже отмеченное выше свойство, обес­ печиваемое трехфункциональной структурой признака, которое позво­ ляет на основе базового набора из нескольких десятков функционалов каждого вида получать тысячи различных признаков в режиме автома­ тической компьютерной генерации.

Генерация триплетных признаков осуществляется формальным об­ разом на основе имеющейся библиотеки функционалов для обучаю­ щей выборки, без учета геометрического смысла и других априорных характеристик получаемых признаков. Затем осуществляется отбор, согласно некоторому критерию, как можно меньшего числа наиболее информативных признаков. Отбор признаков часто называют процес­ сом минимизации размерности признакового пространства, который основан на применении аппарата математической статистики и теории информации. Основным преимуществом данного подхода является его универсальный характер, позволяющий применять его в тех случаях, когда выделить конкретные геометрические характеристики, важные для классификации, представляется затруднительным (а такие случаи, пожалуй, составляют большинство при решении прикладных задач). Недостатком подхода являются большие вычислительные затраты на обучение распознающей системы, поскольку мы вынуждены генериро­ вать, а затем селекционировать тысячи признаков с целью выделения небольшого числа наиболее информативных.

216 Гл. 10. Распознавание сложноструктурированных изображений

Второй подход основан на способности признаков стохастической геометрии хорошо отражать геометрические характеристики распозна­ ваемых объектов (форму, размер, выпуклость, ровность контура, ори­ ентацию и т. п.). Это позволяет изначально сформировать небольшое число информативных признаков, подбирая для этого функционалы с заданным геометрическим смыслом. Мы называем данный подход экстракцией признаков. Он хорошо применим при распознавании изоб­ ражений с достаточно четко выделяющимися геометрическими харак­ теристиками распознаваемых образов каждого класса, при малом числе классов распознавания.

Таким образом, выбор используемого подхода, прежде всего, зави­ сит от количества классов и специфики распознаваемых изображений.

При разработке систем, связанных с распознаванием изображений из области медицинской диагностики, находят применение оба под­ хода, причем каждому подходу соответствует своя группа признаков. С точки зрения происхождения в медико-диагностических системах можно выделить две группы признаков: стандартные признаки и аб­ страктные признаки.

Стандартные признаки — это характеристики изображений, име­ ющие ясный смысл с точки зрения медицины. Именно эти признаки используются для интерпретации результатов исследования професси­ ональным врачом-диагностом. Определение таких признаков реализу­ ется на основе процедуры экстракции.

Абстрактные признаки — это числовые признаки, имеющие ис­ ключительно математическое происхождение. Мы не знаем их смысл с точки зрения медицины, однако мы можем показать, что они успешно разделяют изображения на классы в соответствии с поставленным ди­ агнозом. Автоматическое формирование информативных абстрактных признаков реализуется с помощью процедуры генерации.

Система распознавания гистологических изображений ткани щи­ товидной железы должна обеспечивать их разделение на следующие классы: нормальная щитовидная железа, неопухолевые поражения (зоб), доброкачественная опухоль (аденома) и злокачественная опухоль (рак).

Поскольку нам известен ряд геометрических свойств, используемых для постановки диагноза врачами-гистологами, мы можем построить ряд признаков путем экстракции. Для этого мы выберем функционалы, чувствительные к этим геометрическим свойствам.

Одной из таких важных характеристик является размер фолликул, который можно оценить, используя для построения признака следую­ щие функционалы:

T (F

1

f(e,p,t)dt ;

( 10. 1)

П /)

 

п{в,р)

,

 

F n l ^ 0

R

Р(Т (Д П /))

т (g(e,p)dp;

10.2. Генерация и экстракция признаков распознавания

217

 

 

П(Д) = 0 (P (T (F П /)))

Р(д(0,р))М,

 

—7Т

где п(в,р) — функция числа пересечений изображения F прямой l(0,p,t), R — радиус сетчатки. Из гистограмм на рис. 10.3 (см. цветную вклейку) видно, что полученный признак позволяет различать опухо­ левые и неопухолевые поражения, но не пригоден для определения типа опухоли. Проанализировав множество признаков, отражающих характеристики фолликул, мы пришли к выводу, что это является их общим свойством.

Для различения типа опухоли необходимо задать признаки, отра­ жающие свойства ядер.

Используя бинарные изображения ядер, мы определяем признаки, характеризующие правильность формы ядер. Ядра нормальных клеток имеют форму, близкую к эллипсу. Ядра раковых клеток, как правило, отличаются неправильной, угловатой формой. Определим функцио­ нал Т как число пересечений изображения со сканирующей прямой:

T ( F n l ) = п{р,в).

Функционал Р определим как среднее значение функции на ин­ тервалах, в которых ее значение отлично от нуля. Функционал 0 определим как среднее значение. Полученный признак будет являться числовой характеристикой правильности формы объекта. Если значе­ ние признака близко к двум — объект имеет правильную форму, если значительно больше двух — неправильную. Используя полутоновые изображения ядер, мы можем определить более сложные признаки, основанные на трейс-функционалах, чувствительных к перепадам ин­ тенсивности, распределению интенсивности и т. и. Ядра доброкаче­ ственных опухолей, как правило, имеют более равномерную интенсив­ ность, в то время как для ядер злокачественных опухолей характерно наличие темного контура и светлых, «прозрачных» областей в центре. Для формирования признаков, чувствительных к этому свойству ядер, предлагается в качестве функционала Т взять площадь области S между сечением изображения F прямой I и выпуклой оболочкой этого сечения. На рис. 10.4 (см. цветную вклейку) область S выделена штриховкой.

Вместе с тем, подход на основе формирования признаков, чув­ ствительных к заданным геометрическим характеристикам, позволя­ ет получить довольно ограниченное число признаков и не позволяет обнаружить неочевидные информативные характеристики, которыми богаты сложные изображения. Как уже было отмечено, в этом случае необходимо использовать генерацию признаков.

Генерация триплетных признаков осуществляется на основе имею­ щейся библиотеки функционалов для обучающей выборки, без учёта геометрического смысла получаемых признаков. Затем осуществляет­

ся отбор, согласно некоторому критерию,

как можно меньшего чис­

ла наиболее информативных признаков.

Отбор признаков называют

218 Гл. 10. Распознавание сложноструктурированных изображений

процессом минимизации признакового пространства. Основным пре­ имуществом данного подхода является его универсальный характер, позволяющий применять его в тех случаях, когда выделить конкретные геометрические характеристики, важные для классификации, пред­ ставляется затруднительным. Недостатком подхода являются большие вычислительные затраты на обучение распознающей системы, посколь­ ку мы вынуждены генерировать тысячи признаков с целью выделения небольшого числа наиболее информативных.

Собранная нами библиотека из десятков функционалов каждого вида позволила нам сгенерировать около 13 000 различных триплетных признаков. С помощью процедуры минимизации признакового прост­ ранства, основанной на коэффициентах разложения Карунена-Лоэва, из этого числа было отобрано 59 наиболее информативных признаков. Детальное описание процедуры минимизации см. в главе 7.

Взаключение отметим, что методы стохастической геометрии

ифункционального анализа применимы для распознавания сложно­ структурированных изображений, к которым относятся гистоло­ гические изображения из области медицинской диагностики [66].

10.3. Решение задачи распознавания гистологических изображений на основе применения решёток, обобщающих геометрии Уилла 1

Приводимые исследования представляют одно из направлений повы­ шения эффективности диагностики онкологических заболеваний щито­ видной железы на основе применения методов теории распознавания образов. С помощью специальной предварительной обработки цветные изображения гистологических препаратов преобразуются в трехцвет­ ные изображения, пригодные для дальнейшего выделения признаков распознавания методами стохастической геометрии, эффективность ко­ торых была подтверждена в научных исследованиях [43, 63, 65, 66, 96, 99]. Особенностью метода стохастической геометрии является возмож­ ность автоматической генерации большого числа (до 65000) конструк­ тивных признаков распознавания на основе композиции трех функ­ ционалов (триплетных признаков). Таким образом, признаковое опи­ сание задачи распознавания в рассмотренном случае имеет большую размерность и характеризуется относительно малым числом объектов наблюдения (прецедентов) и большим количеством признаков описа­ ния. Возникает проблема поиска наиболее информативных фрагментов описаний распознаваемых объектов (элементарных классификаторов).

Постановка задачи. Известны методы поиска элементарных клас­ сификаторов, основанные на дискретных методах анализа информа­ ции в задачах распознавания, использующие алгебраический подход, булевы матрицы и обладающие рядом преимуществ по сравнению со

1 § 10.3 написан совместно с В. Б. Лебедевым и С. В. Романовым.

10.3. Решение задачи распознавания гистологических изображений 219

статистическими методами [10, 11, 28]. В настоящей работе предла­ гается теоретико-решетчатая модель пространства признаков, постро-

п

п К А, где П К А -

енная с помощью оператора замыкания А =

 

Ка€{К}

пересечение всех таких множеств из порождающего семейства {К}

признаков, которые содержат множество А, А С S, А С К А, S = [jK. Каждое порождающее множество К е {К} является описанием преце­

дента и состоит из множества признаков в исходном описании объекта

п

распознавания. Оператор А определяет на множестве S семейство замкнутых подмножеств, которые образуют относительно включения

полную решётку Lf с

теоретико-решетчатыми операциями

А Л В =

П

 

П

П

п

= А п В и А\ / В = А и В, где Л, В Q S н А = А, В = В, а операция U

означает замыкание объединения множеств А и В [18,

115].

 

Свойства решетки

L f . Решетка

L/ интерпретируется

как упо­

рядоченное семейство

элементарных

классификаторов {К}, задан­

ных замкнутыми множествами значений классификационных призна­ ков К = {к}. Решётка L f рассматривается как модель пространства признаков. В общем случае каждое порождающее множество мо­

жет быть представлено в виде конъюнктивного множества К =

К х

букв

двоичного алфавита

и

определено

следующим

образом К х =

= «

, '

........... х% .............<

; } .

ч

е { 1 , 2 , ...,п \,

xik,a k е { 0 , 1 } , <

=

щ;,

x\k = x ih'<

пРи

V ^

I1’

xik

Ф 0; k = l , r ;

r ^ n

[18].

Элемен­

тарной

конъюнкцией

ранга

г

над

конъюнктивным множеством

К х

букв Х п называется

выражение ЩКХ ) =

Г

где х?* <ЕK xr , к =

&

= 1 ,г,

г ^ п,

& —

символ

операции конъюнкции.

Семейство

по­

рождающих множеств

{К }

разбивается

на

непересекающиеся клас­

сы множеств

{/С1} ,..., а} ,..., {К"1}

и

каждому

классу

а

ста­

вится в соответствие слабоопределенная функция алгебры логики (ФАЛ) f a(x 1, Х2 , • • •, хп), а = 1, .... 7 , равная 1 на наборах признаков, являющихся описаниями обучающих объектов из класса { К а}, и равная 0 на наборах, описывающих остальные обучающие объекты. Элементарными классификаторами объектов распознавания в такой постановке задачи являются сокращенные дизъюнктивные нормаль­ ные формы (ДНФ) ФАЛ. Для решения задачи поиска элементарных классификаторов необходимо решить задачу минимизации описания ФАЛ, которая в общем случае имеет асимптотически экспоненциаль­ ную трудоемкость решения. Методы КУМ-технологий, использующие отношения упорядочения на решетке конъюнктивных множеств Lf, позволяют уменьшить трудоемкость алгоритмов. Другой подход, поз­ воляющий уменьшить трудоемкость поиска элементарных классифи­ каторов, связан с использованием в качестве конъюнктивных мно­ жеств букв К 6 {К} множеств, не содержащих логических отрицаний переменных. Например, вместо порождающего семейства множеств букв {К} = { {щ,х2, щ } , { щ , х 2,х3} , ... ,{х\,х2, щ}} используется се­

220 Гл. 10. Распознавание сложноструктурированных изображений

мейство

множеств {К} = {{х2 },{х2 з},..., (дц, жг}}.

Такой подход

основан

на понятии «почти допустимой элементарной

конъюнкции»

и позволяет за счет исключения части условий, которым должны удовлетворять искомые информативные фрагменты описаний объектов, получать приближенные решения, но менее трудоемким способом [10].

Структурные нуль 0 и единица 1 решётки задаются выражениями

o = 0 = n К 0 = n K , 1 = S = { J K =

и К. Решётка Lf явля­

йте^}

ке{к}

ется частным булевой решётки B ( S ) относительно оператора замыка-

п

ния А = Р| К а , причём нижние грани в Lf совпадают с нижними гра­ нями в B(S) [18]. Далее перечислены некоторые практически полезные свойства решётки Lf, которые важны для анализа информативности элементарных классификаторов [115].

Свойство 1. Каждый элементарный классификатор, входящий в порождающее множество К Е {К} признаковых описаний, является элементом решётки Lf.

Свойство 2. Каждый коатом решётки Lf является множеством порождающего семейства признаков К Е (А”}.

Свойство 3. Если различные элементы решётки Lf являются сравнимыми, то мощность предшествующего элемента меньше, чем мощность последующего, т. е. если А, В Е Lf и А -<В, то |Д| < |В|.

Свойство 3 позволяет ограничивать детализацию построения ре­ шетки, если заданы ограничения на мощность множества признаков в описании элементарных классификаторов.

Определение. Покрытием тт( 1 ) элемента решётки I Е L f называет­ ся такое подмножество её элементов, которое удовлетворяет условию 7г(/) := Е Lf | а -< •/}, где -< • — знак оператора плотного покрытия элементов решетки.

В частности, покрытия элементов, являющихся признаками класса (обычно это — атомы решетки), образуют семейство минимальных элементарных классификаторов.

Реализация метода. Одной из проблем реализации данного метода является высокая алгоритмическая трудоемкость решаемых задач. Ал­ горитмические методы построения КУМ в виде решётки Lf являются весьма важными для практики. Однако исследования показали, что алгоритмы данного типа имеют комбинаторный характер и обычно об­ ладают экспоненциальной асимптотической трудоёмкостью, улучшить которую очень сложно. Вместе с тем, решение ряда реальных примеров показало, что фактическая трудоёмкость часто является невысокой и, более того, она значительно меньше трудоёмкости многих других, известных алгоритмов.

Один из основных алгоритмов построения решётки Lf с помо-

п

щью оператора замыкания А = Q К а представляет собой процеду­ ру попарного сравнения элементов таблиц описаний элементарных классификаторов с последующим образованием новых таблиц [18]. В