Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Другие файлы / Лурье И.К. - Геоинформационное картографирование - М., КДУ - 2008.pdf
Скачиваний:
120
Добавлен:
01.05.2023
Размер:
14.5 Mб
Скачать

8.4. Алгоритмы классификации

379

в значительной степени определяющий количество зеленой растительности в отображаемой области (соответствующая ось пространства ортогональна к оси яркости почв);

влажность — относится к влажности почв и влагосодержанию атмосферы.

Путем линейных комбинаций зональных значений осуществляют преобразование спектрального пространства — поворот его осей, предоставляя пользователю возможность визуального анализа изображения каждого из новых признаков [Лурье, Косиков, 2003].

Преобразованные описанными выше способами спектральные признаки используют для построения новых изображений, по которым интерактивно определяют эталонные значения этих производных признаков и диапазоны их изменения в пределах выделяемых объектов. Контуры объектов на этих изображениях оцениваются дешифровщиком, знающим местность, или сопоставляются с контурами на картах, схемах полевого дешифрирования и т. п.

8.4.Алгоритмы классификации

8.4.1.Правила и типы автоматизированной классификации

Автоматизированное географическое дешифрирование снимков основано на выполнении классификации объектов, изобразившихся на снимке. Процесс осуществляется в спектральном пространстве и состоит в распределении всех пикселов снимка по классам в соответствии с отражательной способностью каждого из них в одной или нескольких зонах спектра, например, типы растительности или классы использования земель (городские территории, пастбища, пашни, водные объекты, леса). Если пиксел удовлетворяет определенному набору условий, он приписывается к классу, который соответствует заданному критерию. Трудности классификации связаны, прежде всего, с изменчивостью признаков — отражательная способность меняется в зависимости от времени суток, сезона и т. д. Поэтому правила классификации для разных снимков могут и не совпадать. Часто классификация бывает неопределенной и неточной, поскольку по значениям спектральной яркости пикселы могут относиться сразу к нескольким классам, да и сам пиксел растра может представлять интегрированную характеристику объектов разных классов — это так называемые смешанные пикселы. Несмотря на это в процессе

380 Глава 8. Цифровая обработка изображений

классификации неопределенность игнорируется, и каждый пиксел помещается в один из классов. Наилучшего метода классификации не существует, есть более удачные системы, которые обычно требуют больших затрат времени и могут быть весьма дорогими.

Выделяемые по снимку классы могут быть связаны с известными объектами земной поверхности или просто представлять области, которые «смотрятся различно» на экране монитора. Следует подчеркнуть, что пока классифицированное изображение не приведено в систему координат карты и не оформлено в соответствии с ней, оно может называться только картой (схемой) классификации.

В основе методов автоматизированной классификации лежит математическая теория распознавания образов, которая вырабатывает правила классификации реальных или геометрических объектов по их характерным деталям или признакам. При пространственном и спектральном улучшении изображения на экране монитора распознавание образов выполнимо визуально — мозг человека автоматически сортирует определенные текстуры и цвета в те или иные категории. При помощи компьютерной системы пикселы распознают и сортируют на основании математического критерия.

Согласно теории распознавания образов, для классификации нужно разделить пространство признаков на замкнутые области, каждая из которых содержит значения признаков, характерные для одного из классов объектов, и приписать каждый пиксел снимка тому классу, в область которого попал его вектор признаков. Границы, разделяющие получаемые области, называются решающими (разделяющими), а сами области — областями решения. Способ отнесения пикселов снимка к областям решения (классам объектов) определяет так называемое решающее правило — правило классификации, реализацию которого обеспечивает соответствующий компьютерный алгоритм. Правило классификации обычно формируют на основе признаков типичных объектов, принадлежность которых к определенному классу известна (например, признаки эталонных объектов на тестовых участках). Но прежде всего компьютерная система должна быть обучена распознаванию образов на основе таких данных и в процессе обучения должен быть найден критерий распознавания образов.

Алгоритмы компьютерного анализа, реализующие различные правила классификации, подразделяются на два типа: алгоритмы контролируемой и неконтролируемой классификации. При конт-

8.4. Алгоритмы классификации

381

ролируемой классификации правила перехода от показателей спектрального отражения к положению в системе классов объектов выверяются на «учебном» участке (тестовом, эталонном) на основе набора признаков, введенных специалистом-дешифровщиком (пользователем), — обучающей выборки, а затем автоматически применяются и на остальной части снимка (поэтому эти алгоритмы иногда называют «классификацией с обучением»). При контролируемой классификации важно знать число и тип выделяемых классов

итолько затем создавать обучающие выборки, соответствующие данным снимка. Необходимо также располагать критериями и способами распознавания классов, представленных пикселами.

Неконтролируемая классификация выполняется автоматически

изависит только от данных снимка.

Контролируемая классификация применяется обычно при идентификации сравнительно небольшого числа классов, когда выбраны такие тестовые участки, которые могут быть проверены по достоверным наземным данным, или когда можно выделить хорошо различимые, однородные области, представляющие каждый класс. С другой стороны, если необходимо создать классы по присущим пикселам спектральным отличиям, то для этой задачи лучше подходит неконтролируемая классификация. Она позволяет легко выделить множество таких классов (групп пикселов). Неконтролируемая классификация может быть полезной для создания тематически определенного набора классов с использованием последующей контролируемой классификации. Применение комбинации классификаций, неконтролируемой и контролируемой — гибридной — дает оптимальные результаты, особенно для значительных массивов данных (например, для снимка, составленного из серии последовательных кадров съемки).

8.4.2. Алгоритмы контролируемой классификации

Методы контролируемой классификации учитывают априорную (уже известную) информацию:

о типах объектов и вероятности их представления данными снимка;

об эталонных значениях спектральных характеристик этих объектов (эталонных значениях их спектрального образа), от качества которых зависит точность и достоверность классификации.

382 Глава 8. Цифровая обработка изображений

При этом дешифровщик выбирает пикселы, представляющие эталонные участки, используя помимо космического снимка другие источники — аэрофотоснимки, точные данные о земной поверхности или карты. Считается, что истинные «наземные» данные — наиболее точные из всех имеющихся сведений об области исследования. Чтобы возможно более полно соответствовать снимку, они должны быть собраны синхронно с его получением (данные подспутниковых наблюдений). Добиться такого соответствия достаточно сложно из-за погрешностей измерений и атмосферных факторов. Поэтому полезна информация не столько о точных спектральных характеристиках объектов, сколько об их местоположении. Пользователь-дешиф- ровщик полагается также на собственные знания и опыт распознавания образов, помогая компьютерной программе определить критерий и эталоны для классификации объектов по снимку.

Создание обучающих выборок. Обучающие выборки, которые также называют эталонами объектов (signatures), — наборы пикселов, которые представляют распознаваемый образ или потенциальный класс, служат их идентификации. Обычно это некоторый участок на снимке, идентифицированный на основании истинных данных о земной поверхности. Выбор эталона в значительной степени зависит от знания пользователем данных, исследуемой области и классов, которые он хочет выделить.

Основным требованием к данным обучающих выборок является их репрезентативность — пикселы выборки должны отвечать одному классу на местности; такой класс должен занимать территорию, которая достаточно хорошо представлена пикселами на снимке с заданным разрешением. В спектральном пространстве репрезентативность выборок обеспечивают:

одномодальность гистограммы распределения яркости, характеризующая близость распределения значений к нормальному (поскольку нормальное распределение данных является исходной посылкой алгоритма);

минимальность дисперсии, которая характеризует однородность данных выборки;

небольшие значения отклонений от среднего, так как иначе выборка теряет свою представительность;

разделимость выборок в спектральном пространстве (поскольку иначе произойдет перепутывание и смешение классов).

8.4. Алгоритмы классификации

383

Для выбора эталонов и создания обучающих выборок используют разные способы:

идентификация набора соседних пикселов с близкими спектральными характеристиками;

определение области изображения — идентификация пикселов в пределах определенной области (объекта) не обязательно с аналогичными спектральными характеристиками;

использование класса из тематического растрового слоя в ГИС, соответствующего области снимка или, например, полученного в результате неконтролируемой классификации;

использование векторной карты (слоя), наложенной на снимок.

В большинстве программных пакетов обработки изображений для создания обучающих выборок используют средства цифрования (мышь, дигитайзер), позволяющие построить векторные полигоны вокруг эталонных пикселов или участков снимка. Полигоны могут быть оцифрованы как по снимку, так и по карте. Области в пределах таких полигонов и используют для определения числовых значений обучающих выборок.

Иногда изображение нужных объектов настолько «пестрое», что для них сложно построить полигон обучающей выборки, опираясь на визуальную оценку близости значений яркости (или цвета) пикселов. Для таких случаев подходит способ создания обучающей выборки, реализованный, например, в пакете ERDAS Imagine. Он основан на идентификации (указании курсором) только одного пиксела, который может быть уверенно отнесен к области выделяемого класса. Эталон создается путем сопоставления его с соседними пикселами, основываясь на введенном пороговом значении близости. Это либо географическое расстояние, либо стандартное отклонение яркостей для каждой зоны. Поиск подходящих пикселов в окне осуществляют среди четырех либо восьми соседних. Процесс построения такой выборки итерационный и повторяется до тех пор, пока не останется пикселов окружения, удовлетворяющих заданным параметрам. С каждой итерацией выборка как бы «разрастается» из заданного пиксела. Этот способ, выделяя область на снимке, позволяет выделить реальную область на земной поверхности с близкими свойствами.

384 Глава 8. Цифровая обработка изображений

Обучающие выборки подразделяют на параметрические и непараметрические. Параметрическая выборка основана на статистических параметрах, например, векторе средних значений яркости Ми коэффициентах ковариационной матрицы /С, вычисленных по зональным значениям пикселов в полигоне обучающей выборки или кластере. При этом автоматически предполагается, что распределение данных нормальное. Чаще всего создание таких обучающих выборок осуществляют в интерактивном режиме. Дешифровщик опознает на экране монитора эталонные объекты, относящиеся к выделяемым классам (обычно выбираются 3 - 4 объекта для каждого класса), и в пределах каждого объекта рисует мышью векторный полигон (в общем случае — многоугольник), полностью вписывающийся в изображение объекта на экране. Программа создания обучающих выборок по значениям яркости п. пикселов, попавших в полигон, вычисляет для каждого класса объектов М. и К.. В результате обучающие выборки приобретают форму эллипса, и каждый объект теперь может быть представлен эллипсами равной вероятности (см. параграф 5.1.2) (рис. 8.14 а). Такая процедура позволяет обеспечить соответствие измерений обучающих (эталонных) и проверяемых (классифицируемых) объектов.

В4

Зона 1

а

б

Рис. 8.14. Параметрические и непараметрические обучающие выборки:

a — эллипсы равной вероятности; б — пример изображения спектрального пространства признаков

Непараметрическая выборка основана не на статистике, а на дискретных объектах — полигонах или прямоугольниках, образуемых

8.4. Алгоритмы классификации

385

созданной пользователем выборкой, в изображении спектрального пространства признаков (рис. 8.14 б). Изображение пространства признаков в этом случае представляет собой двумерную гистограмму — график зависимости значений яркости одной зоны снимка от значений другой; такую гистограмму называют диаграммой разброса. Значения в точках такого изображения являются аккумулированной частотой встречаемости пикселов снимка с комбинацией зональных значений яркости, указываемых положением этой точки. Для изображения спектрального пространства используют цветовую палитру, в которой светлые тона соответствуют высокой плотности точек, темные — низкой. Созданные объекты пространства признаков применяют для определения границ классов: пикселы приписывают к классу на основе их местоположения внутри указанной области диаграммы разброса (рис. 8.15).

а

б

в

Рис. 8.15. Процесс определения эталонного объекта в пространстве признаков: а — исходное изображение, синтезированное по трем зонам спектра; б — диаграмма разброса в двух зонах; в — рисование полигона, задающего объект в пространстве признаков (полигон белого цвета)

Такой способ определения эталонов не зависит от статистики значений яркости пикселов, что помогает повысить достоверность классификации таких специфических объектов, как городские территории и скалистые горные массивы.

Оценка качества эталонов. Выбор эталонов зачастую является итерационным процессом. Для создания эталонных выборок, точно представляющих подлежащие идентификации классы, целесообразно неоднократно выполнять и оценивать выборку(и) либо манипулировать созданными выборками: объединять, полностью или частично, удалять или добавлять из одного файла выборок

386

Глава 8. Цифровая обработка изображений

в другой. Используя различные комбинации зон, можно создать столько двумерных изображений пространства признаков, сколько потребуется для оценки качества выборок.

Выполненное однажды построение объекта в пространстве признаков позволяет затем использовать его как готовый эталонный спектральный образ некоторого определенного класса при дешифрировании других снимков или в разных методах классификации.

Для оценки качества созданных любым методом выборок удобно использовать следующий способ. По значениям яркости пикселов выборок рассчитывают параметры эллипсов рассеяния — средние значения и стандартные отклонения пикселов, сохраненных в файлах обучающих выборок. Эти параметры используют для представления эллипсов разных классов в двумерном пространстве признаков (в двух зонах). Если эллипсы на диаграмме разброса имеют значительное перекрытие, то пикселы, представляющие эти выборки, не могут быть разделены по спектральным характеристикам в этих зонах. На рис. 8.16 а и б показано графическое отображение эллипсов в пространстве признаков, построенных с учетом двух стандартных отклонений от среднего, и их возможное перекрытие. Меняя число стандартных отклонений, можно изменить форму и положение эллипса, что способствует оценке и уточнению эталонов.

Перекрывающиеся выборки

Разделимые выборки

а б

Рис. 8.16. Оценка выборок на основе построения эллипсов рассеяния:

a — перекрывающиеся выборки; б — разделимые выборки (Л, В, С и D — зоны исходного снимка)

8.4. Алгоритмы классификации

387

Анализ графиков, построенных для всех пар зон снимка, позволяет оценить разделимость выборок, а также определить, какие выборки и какие зоны будут обеспечивать лучшие результаты классификации.

Очевидно, что разделимость выборок-эталонов основана на оценке статистического расстояния между двумя выборками. Чаще всего его задают как евклидово расстояние — спектральное расстояние между векторами средних значений каждой пары выборок в пространстве признаков

|2

(8.10)

где R(MkvMk2)- расстояние между классами к\ и к2, MkvMk2 средние значения выборок классов (центры классов в спектральном пространстве), зональные координаты векторов средних значений классов, L — число зон.

Если это расстояние незначительно для любой пары зон, то выборки различимы недостаточно для проведения успешной классификации.

Часто при оценке обучающих выборок вводят весовые коэффициенты, которые основаны на априорной вероятности правдоподобия отнесения любого их пиксела к тому или иному классу. Например, если известно, что классу А должно быть приписано вдвое больше пикселов, чем классу В, то класс А получит вдвое больший весовой коэффициент. Это позволяет оценить вероятность ошибки классификации.

Во многих случаях построение и оценка выборок должны быть повторены несколько раз прежде, чем они будут использованы при классификации.

Решающие правила классификации. После создания и оценки обучающих выборок пикселы изображения сортируют по классам, основанным на этих выборках, посредством решающего правила классификации. Каждый пиксел подвергается независимому анализу, при этом его вектор значений яркости сопоставляется с каждым эталоном с применением разных алгоритмов.

При разработке таких алгоритмов используются детерминированный и статистический подходы. Детерминированный подход применяется, как правило, когда классы объектов не пересекаются

388 Глава 8. Цифровая обработка изображений

в пространстве признаков. В этом случае области решения могут быть выделены линейными границами, которые определяются линейными разделяющими (дискриминантными) функциями (рис. 8.17). Каждая такая функция характеризует свой класс дешифрируемых объектов и строится, например, так, что для пикселов своего класса, определяемого эталоном, она принимает положительное значение, а для чужого — отрицательное. В качестве дискриминантной функции нередко используют формулу евклидова расстояния.

Поскольку классы объектов нередко перекрываются в пространстве признаков, то и области решения могут пересекаться, что приводит к неоднозначным результатам классификации. Статистические методы позволяют учитывать случайные вариации признаков и допускают отнесение пикселов к чужим «классам», если частота их появления относительно мала.

Метод параллелепипеда реализует наиболее простой алгоритм, основанный на детерминированном подходе. В этом алгоритме в пространстве признаков создают эталонные объекты с известной принадлежностью к разным классам, а в качестве их эталонных характеристик задают значения спектральных яркостей в границах интервалов, выделяемых дешифровщиком по эталонным объектам этих классов в изображении каждой зоны снимка. Такие интервалы определяют в пространстве признаков некоторую замкнутую область, размерность которой равна числу зон многозонального снимка: это прямоугольник для двух зон, параллелепипед — для трех и более зон. Значения яркости, соответствующие границам интервалов, задают вершины этих параллелепипедов.

Выделение интервалов изменения яркости для объектов, выбранных в качестве эталонных, как правило, производят путем анализа гистограмм в двух зонах снимка. Их границы определяют как:

минимальные и максимальные значения яркости в каждой зоне в пределах эталонного объекта на снимке;

среднее значение яркости в каждой зоне плюс-минус число стандартных отклонений;

любые определяемые пользователем границы на основании его знаний данных снимка и эталонов. Источником этих знаний могут быть рассмотренные выше методы оценки обучающих выборок.

8.4. Алгоритмы классификации

389

Каждый пиксел снимка относится к тому классу, в чей параллелепипед он попадает по своим значениям яркости при сравнении с верхними и нижними границами интервалов (рис. 8.18).

 

Г'сс^

 

! С С ;

 

н нн

 

Н Кн

 

W у

 

W W

 

w

Рис. 8.17. Построение

Рис. 8.18. Классификация методом

дискриминантной функции

параллелепипеда

(а-еклассы групп пикселов)

 

В тех случаях, когда пиксел

попадает в область перекрытия

двух и более параллелепипедов, необходимо определить, к какому классу его следует отнести. Проблемы классификации возникают и при диагональной вытянутости класса относительно его параллелепипеда: попадание пиксела в его границы не является хорошим признаком класса (пиксел 1 на рис. 8.18).

Преимущества метода параллелепипеда заключаются в том, что он позволяет быстро разделить значения яркостей пикселов на группы, сравнивая их с граничными, которые остаются постоянными для зон каждого эталона. Классификация выполняется за один проход и не требует нормального распределения данных.

Алгоритмы классификации по минимальному расстоянию.

Если имеется возможность получить эталонные спектральные характеристики классов, то задачу классификации можно решить простым в вычислительном отношении способом — по минимальному расстоянию между классами в пространстве признаков. Поскольку измеренные и эталонные спектральные признаки объектов точно не совпадают, то решение о принадлежности пикселов к тому или иному классу принимается на основании анализа некоторой меры близости.

390 Глава 8. Цифровая обработка изображений

Решающее правило минимального расстояния рассчитывает спектральное расстояние между вектором значений яркости пиксела и вектором средних значений каждого эталона (обучающей выборки). Пиксел приписывается к классу с ближайшим средним значением.

Так как для каждого пиксела всегда существует ближайший эталон, то неклассифицированных пикселов нет. Поскольку метод не учитывает изменчивость яркости в классе (дисперсию), то он плохо классифицирует, например, городские территории, образуемые пикселами с высокой дисперсией. И, наоборот, в класс с минимальной дисперсией, наподобие класса воды, может быть отнесено существенно больше пикселов, чем положено.

При применении статистических подходов методы классификации чаще основываются на использовании функции распределения вероятности, связанной с классифицируемыми объектами.

Алгоритм

классификации на основе метода

максимального

правдоподобия.

Наиболее часто применяется метод классификации,

в основе которого лежит статистический подход к решению задачи классификации и предположение, что появление на снимке объекта, относящегося к i-uy классу, является случайным событием оз.. Множество всех случайных событий — объектов на снимке — обозначим Q(cor ... ,сои). Вектор признаков X также считается векторной случайной величиной.

Для решения задачи нужно знать: Р(со.) — априорную вероятность появления объекта класса i\ Р(Х/со;) — функцию условной плотности распределения вероятностей вектора признаков X, если объект относится к классу сог

Если эти характеристики известны, то классификацию целесообразно осуществлять на основе Байесова решающего правила. Поясним теорию на примере двух объектов А и В. До того, как измерен признак в некоторой точке, вероятность того, что в ней находится объект А — априорная вероятность Р(А) — равна доле площади объекта А от площади всего снимка. После измерения

признаков эта вероятность меняется, и соответствующая

апостери-

орная вероятность Р(А/Х) по формуле Байеса равна:

 

Р(А/Х)~

Р ( А ) Р ( Х / Л )

(8.11)

V ' '

Р ( Х / А ) Р ( А ) + Р ( Х / В ) Р ( В ) •

8.4. Алгоритмы классификации

391

Здесь условные вероятности Р(Х/ЛУ и Р(Х/В) отражают различия в яркости объектов. Решающее правило может быть сформулировано так: решение будет в пользу объекта А в той области пространства

признаков, где

> Р(Х/А)Р(В),

(8.12)

Р(Х/В)Р(В)

что эквивалентно

 

(8.13)

Р{Х/А)/Р{Х/В)

> Р(В)/Р(А).

К объекту А будут отнесены все точки с измеренными

призна-

ками X, для которых это неравенство выполнено. Введенная заранее так называемая функция потерь (весовые коэффициенты в условии (8.13)) позволяет установить цену каждого действия по принятию решения. На практике априорные вероятности и потери известны редко, поэтому предполагаются равными, так что решающее правило перейдет в условие Р(Х/А)/Р(Х/В) > 1, или Р(Х/А) > Р(Х/В), т. е. классификация относит каждое измерение к тому объекту, для которого правдоподобие получения этого измерения максимально. Поэтому и метод получил название «максимального правдоподобия».

В общем случае для классификации этим методом необходимо знать статистические характеристики дешифровочных признаков всех объектов. Эту информацию часто получают путем анализа яркостей в пределах эталонных объектов на снимке — построения обучающих выборок. Функции Р(Х/со.), которые называются обучающими, получаются на основе этой информации и считаются априори известными.

По условию задачи функции плотности распределения вероятности Р(Х/со.) известны априори только для тех п объектов, которые подлежат классификации. Если на снимке имеется несколько классов объектов, априорная информация о которых либо отсутствует, либо они не классифицируются, то без потери общности они могут быть отнесены в один я + 1-й класс. Апостериорную вероятность для этого

класса находят по формуле

 

Р{^/Х)=\-±Р{Щ/Х).

(о-14)

i=i

Процесс построения P(X/iо.) называется обучением классификатора. При этом используют параметрический и непараметрический

1 Р(Х/А) — правдоподобие класса Л при данном X.

392 Глава 8. Цифровая обработка изображений

подходы к определению статистических характеристик. В первом случае известен вид распределения плотности вероятности, который, как правило, предполагается нормальным. Во втором случае строят гистограммы яркости объекта, считая при этом, что гистограмма и есть дискретно заданная Р(Х/со.).

Пусть априори предполагается, что распределение спектральных яркостей пикселов объекта на многозональном снимке подчинено нормальному закону. Тогда плотность распределения случайного вектора Х= (Xv..., Х Д в данном случае измерений яркости пиксела

i-ro класса в L-мерном пространстве, имеет вид

 

P(XM-)=

1 = •

*

ехр(-У2(Х-МуК-{

ЧХ-М,»,

W

Д

)

7

(8.15)

где L — число зон спектра; М. — вектор средних значений яркости; К. — ковариационная матрица размера LxL для f-го класса объектов.

По множеству измерений спектральных яркостей Хп эталонного объекта со., принадлежащего классу i, получают значения его параметров нормального распределения по формулам:

М,= - I X ,

К{= - Ъ ( Х -

Мх)(Хг

}

Мх)\

(8.16)

nih 1 >

niMx J

 

 

где все п. значений Xj е i-му классу. Аналогично определяют такие параметры для всех эталонных объектов — создают наборы обучающих выборок или эллипсов равновероятных значений (см. рис. 8.14 а).

Для упрощения вычислений выражение (8.15) обычно логарифмируют, и тогда условие максимума правдоподобия имеет вид:

l o g | ( Х - М,ук;\х-

М,)< \og\Kk\+

+ (Х-МкУК-к\Х-Мк).

(8.17)

Если это условие выполняется, то проверяемый вектор X относится к классу i.

Метод максимального правдоподобия является одним из наиболее точных методов при условии, что исходные выборки имеют нормальное распределение.

При значительной дисперсии пикселов в эталонной выборке ее ковариационная матрица будет содержать высокие значения коэффициентов, что приводит к завышенному числу пикселов, отнесенных к ней.