Визуальное интерактивное дешифрирование

Диапазоны длин волн электромагнитного спектра, использующиеся в съемочных системах.

Оптический диапазон(системы пассивного зондирования): 0.3-15 мкм. До него - ультрафиолетовый, дальше 15-100 мкм - инфракрасный, после 100 мкм -радиолокационный (системы активного зондирования). В оптическом: 0.38-0.72 мкм -видимый диапазон; 0.72-1.3 мкм - ближний инфракрасный диапазон (ближний ИК); 1.3 -3.0 мкм - средний ИК; 7.0 - 15.0 мкм - дальний ИК (тепловой). Остальные ИК- диапазоны условно называют отражательными.

Почему пусто между 3 и 7 мкм? Здесь находятся полосы интенсивного поглощения солнечной энергией водяными парами в атмосфере. То есть отражения от земной поверхности крайне мало. Заметим, что с другого конца влияет еще и молекулярное рассеяние в атмосфере. Коэффициент объемного рассеяния Рэлея имеет вид

σR=F(N,V,n,no)A,4. Здесь V - объем, N - число частиц в единице объема, п,по -показатели преломления частиц и среды соответственно.

Ясно, что чем короче длина волны, тем больше рассеяние. Поэтому в сине-голубой зоне видимость плохая, и в большинстве съемочных систем первый диапазон (канал) находится в интервале (0.4 - 0.5). Но он очень информативен для некоторых задач.

В середине 60-х годов 20-го века появились сканирующие радиометры- системы на фотоэлементах, позволяющие получать изображения сразу в цифровом виде. Сначала появились оптико-механические сканеры, затем ПЗС (приборы с зарядовой связью). С этого момента началось интенсивное развитие цифровых методов обработки. Идеология этих методов основана на математических моделях и существенно отличается от визуально-инструментальных методов. При этом методы обработки черно-белых (панхроматических) снимков отличаются от методов обработки цветных снимков и от методов обработки многозональных цифровых изображений.

К концу 20-го века началось интенсивное использование радиолокационных систем для получения видеоинформации. Несмотря на меньшую информативность в целом, радиолокационные изображения,с одной стороны, частично восполняют потерю данных в условиях облачности, с другой - позволяют решать и некоторые специфические задачи, где сам физический принцип радиолокационной съемки более удобен для построения математической модели изучаемого явления.

Таким образом, к настоящему времени мы имеет довольно большое количество разнообразных типов видеоинформации. Все эти виды информации могут быть представлены в цифровой форме с помощью тех или иных технических средств. Сразу скажем, что информативность определенного типа информации для разных задач не одинакова. Конечно, космическая информация на сегодняшний день - самая распространенная, и с каждым годом количество космических съемочных систем растет. Во-первых, она позволяет охватывать большие территории, в том числе труднодоступные, во-вторых, поступает с определенной периодичностью. Однако, если территория покрыта облачностью, приходится восполнять эти данные чем-то, например, аэросъемкой или радиолокационной съемкой.

 

Представление аэрокосмической видеоинформации в цифровом виде. Многозональные и многослойные изображения. Разновидности слоев в пакете ERDAS Imagine. Непрерывные и индексные слои. Создание собственных многослойных изображений средствами пакета ERDAS Imagine.

Наиб инф-ми видеоданными для дешифрирования объектов и процессов на земной поверхности в ресурсно-экологических и смежных направлениях являются многозональные сканерные изображения(МИ), получаемые с космических аппаратов (LANSAT, SPOT, «Ресурс», IRS, Terra и др.). Съемка в различных диапазонах энергетического спектра солнечного излучения позволяет использовать в процессе решения задачи объективные физические модели, связанные со спектральной отражательной способностью исследуемых объектов и явлений.

Основной дешиф-ый признак-спектральная яркость пикселя, соответствующего определенной площади на земной поверхности.

Объективный комп. анализ МИ -классификация пикселей изображения методами, относящимся к теории распознавания образов.

В процессе класс-ии МИ м.б. использованы и др, пространственно совмещенные с ними растровые данные - из-я, полученные др аппаратурой или в др сроки съемки, фондовые карт-е данные, представленные в растровом виде, ЦМР, а также разл-е комбинации каналов, предст-ие интерес для решения конк-ых задач. Из-я будут уже не просто многозональными, а многослойными. Для применимости к многослойным изображениям стандартных процедур классификации необходимо, чтобы все слои были представлены в сопоставимой цифровой шкале. То есть яркость каждого пикселя в слое должна соответствовать значению измеренного или рассчитанного параметра, который характеризует какое-то свойство участка земной поверхности. В терминологии пакета ERDAS Imagine такие слои называются непрерывными (данные для автомат-ой класс-ии), в отличие от дискретных «индексных» слоев, которые называются тематическими. Многозональная съёмка — тип изображений, получаемых в результате регистрации одного и того же кадра косм снимка в разных участках электромагнитного спектра (например инфракрасной и видимой области)

Многослойное изображение - совмещение многозонального изображения с другими растровыми данными, а также с другими комбинациями каналов (приводят снимки к единой си-ме координат(геогр привязка ,трансформирование))

Создание своих собственных МИ

Interpriter-Utiliteas

1.фу-я Layer Stack –собственно создание многослойных изображений.

Условия: единая система координат, одинаковый размер кадра

Возможности функции: вывод нужных слоев =>имя выводного многослойного из-я=>процедура-выбор функции объединения =>объединение

2.Subset-вырезать

Возможности фу-ии: есть координаты х, у => вырезать по координатам нужный кусок изображения, что обеспечит единый формат для всех слоев

3. Два основных подхода к автоматизированной тематической обработке: интерактивное дешифрирование и автоматическая классификация. Общая характеристика процедур тематической обработки, применяющихся в каждом из этих подходов.

Классификация - один из этапов перехода от исходного изображения к растровой тематической карте.

Задачи классиф-ии: разбиение признакового пространства на области, соответствующие различным тематическим категориям (классам) объектов земной поверхности (по каждому измерению классам будут сопоставлены определенные интервалы значений, один или несколько для каждого класса=> метод распознавания образов, основанным на принципе кластеризации.

Автоматическая(неконтролируемая): работа с мног-ми простр признаками

Применяется в случаях:

-Если нет опыта тематической обработке МИ

- заранее известно общее количество классов и типичные для них характеристики образов

Возможность:быстрая оценка, сколько классов разделяется по спектральным характеристикам наиболее надежно и где они содредоточены на из-ии

На 1 этапе вып-ся нек-ая класс-я на большое количество классов и проводится анализ получ-ого результата. Те классы, которые,, соот-ют реальным тем-им объектам, оставляются, остальные, распр-ся по изобр-ию случайным образом, либо объед-ся с уже отобранными классами по близости их спектральных характ-к и относ-му распол-ю на из-ии, либо группируются так, чтобы получить еще какие-то интерпретируемые объекты.

В основе всех алгоритмов этого класса лежит метод кластеризации при заданном количестве групп

Если хотите написать научную работу за 40 минут подготовки, обратитесь к вопросу№7

Визуальное интерактивное дешифрирование

Методы,позволяющие улучшить визуальное восприятие изображения и подчеркнуть признаки тех объектов, которые интересуют дешифровщика:

-высокочастотная и низкочастотная фильтрация

-поднятие контраста

-эквализация гистограмм

-анализ главных компонент

Применяется в случае: если инф-ии слишком много для того, чтобы точно определить, сколько всего классов можно выделить на анализируемом объеме данных=> выбираем только те классы, которые представляют интерес для решения задачи, и определяем их типичные характеристики с помощью процедур обучения.

Процесс:

по умолчанию установлено: R=:4(ближний ИК), G=3(Красный), В=2(зеленый) -три спектральных зон, как наиболее инф-ых для решения знач-ой части тематических задач. В результате RGB-синтеза растительность красная (самая высок отраж-ая способность в ближнем ИК-диапазоне), вода - голубовато-черная или зеленовато-черная (низкая интегральная отраж-ая способность по всем данным диапазонам), сухая почва и искусственные объекты - светло-голубой (наиб высокая интегральная отр-ая спос-ть по всем указанным диапазонам).

Наиболее инф-ые каналы: где можно надежно разделить по используемым признакам наибольшее количество классов. Нужно учитывать: динамический диапазон каналов (количество ненулевых значений яркости), общий диапазон рассеяния точек в проективной плоскости признакового пространства (ПП) для анализируемой пары каналов. Функции пакета ERDAS Imagine позволяют получать эти проективные плоскости признакового пространства и работать с ними.

Спектральная сигнатура пикселя- соответствующий ему вектор (1) значений пикселя по слоям (спектральным диапазонам).

Сигнатура класса- вся совокупность типичных для данного класса n-мерных векторов (1) (для многозональных изображений - спектральных яркостей).

Используя признаковое пространство, можно определить:

• какие каналы наиболее полно отображают представленные на изображении тематические классы;

• где в признаковом пространстве расположены спектральные сигнатуры интересующих аналитика тематических категорий и какие классы будут разделяться наиболее надежно.

После завершения процесса построения все проекции ПП по парам каналов будут выведены на экран, каждое в своем окне.

Лучше всего выбрать пары признаков с наиболее широкими диаграммами рассеяния и наибольшим кол-ом локальных мод (красных или желто-оранжевых пятен на цветном ПП-изображении). Если эти моды соответствуют каким-то тематическим классам, то такие классы будут выделяться наиболее надежно.

Области значений сжаты вдоль нек-го направления => сильная корреляция между данной парой признаков.

Определение положения сигнатур объектов в пространстве признаков.

1.блок Classifier=>Signature Editor. В открывшемся новом окне редактора сигнатур из меню Feature > View > Linked Cursor=>Указать номер ПП-вьюера => Link. Появится сообщение с просьбой указать привязываемое изображение. Щелкните курсором на изображении tm_86516.img. На изображении появится перекрестье, которое будет перемещаться одновременно с перекрестьем в ПП-вьюере и показывать положение пикселя в проективной плоскости ПП.

2.Открыть в окне изображения инструментарий для рисования областей интереса AOI > Tools => оконтурить небольшой объект на из-ии=>добавить в редактор сигнатур сигнатуру выб-ого объекта=>присвоить сигнатуре какой-либо яркий цвет, =>в редакторе сигнатур Feature > Masking > Image to Feature Space. В окне этой функции установите номер ПП-вьюера, в котором Вы хотите отобразить сигнатуру, => Apply=>значения пикселей выбранного объекта отобразятся в ПП-вьюере цветом, присвоенным его сигнатуре.

 

4. Понятие спектрального образа объекта земной поверхности. Основные группы объектов, разделяющихся по спектральным образам. Связь спектрального образа с понятием спектральной сигнатуры. Средства анализа спектральных образов в пакете ERDAS Imagine.

Образ- это совокупность данных об объекте или явлении, включающая параметры и связи.

Если выполнить аэро- или космическую съемку местности одновременно в нескольких зонах спектра и по серии зональных снимков измерить яркости изобразившихся объектов, можно получить аналоги кривых спектральной яркости - спектральные образы объектов.

Распознавание образов - каждый пиксель изображения рассматривается как n-мерный вектор-образ, состоящий из значений яркости в каждом слое

Для многозональных сканерных изображений этот вектор соответствует набору значений спектральной яркости по каналам.

ПП- совокупности всех векторов-образов, которые соответствуют определенному множеству точек в n-мерном пространстве.

Спектральная сигнатура пикселя- соответствующий ему вектор значений пикселя по слоям (спектральным диапазонам)

Спектральные кривые-кривые, показывающие зависимость величины отражения излучения от длины волны, для данного типа наземного покрытия или данного вещества.

Изменение таких показателей, как влажность, содержание биомассы или многих других экологических характеристик поверхности земного участка, даёт изменение значений спектральных каналов космического снимка, а значит - и изменение спектральной кривой или сигнатуры данного участка. Связь СО СС:спектральный образ объекта, это совокупность спектральных сигнатур всех пикселей, из которых состоит этот объект.

Группы объектов:

растительность красная (самая высок отраж-ая способность в ближнем ИК-диапазоне), вода - голубовато-черная или зеленовато-черная (низкая интегральная отраж-ая способность по всем данным диапазонам), сухая почва и искусственные объекты - светло-голубой (наиб высокая интегральная отр-ая спос-ть по всем указанным диапазонам)

В зависимости от особенностей информационных компонент системы R, выделяют три подхода к задаче распознавания образов(процесс синтеза образов):

Принцип сравнения с эталономприменяется в тех случаях, когда каждому классу Ак можно сопоставить конечный набор эталонных образов Процесс распознавания: простое сопоставление образов, поступающих на вход распознающего устройства или алгоритма, с эталонами классов Ак , на основе выбранной меры сходства( пр: распознавание текстур и выделении объектов определенной формы).

Принцип кластеризации. Если признаки представляют собой наборы измерений (параметров) без каких-либо явным образом заданных взаимосвязей, то образ можно представить как n-мерный вектор в признаковом пространстве X:

Каждому классу Ак сопоставляется некоторое множество векторов в пространстве X. В результате признаковое пространство разбивается на области, соответствующие классам Ак, которые называют кластерами или таксонами. Одному классу может соответствовать любое количество областей пространства X. Эти области могут перекрываться, но методология принятия решения должна в конечном итоге обеспечивать однозначное отнесение точки пространства к определенному классу.

Принцип общности свойствиспользует связи между элементами образа=> множество образов каждого класса слишком велико, чтобы получить надежное описание конечного числа эталонов, но можно выявить достаточное количество отличительных особенностей классов по конечным выборкам образов. Выявленные свойства кодируются на основе подходящей модели и хранятся в памяти в виде некоторых структур, функций или отношений. В процессе распознавания производится анализ образа по схеме, позволяющей выявить необходимые свойства образа; затем они сопоставляются со свойствами классов Ак. Обобщающим свойством может быть сам алгоритм порождения образов; в этом случае классы образов задаются алгоритмами порождения структур определенного вида.

Средства анализа:

1.Прямой анализ

Открыть в окне изображения инструментарий для рисования областей интереса AOI > Tools => оконтурить небольшой объект на из-ии=>добавить в редактор сигнатур сигнатуру выб-ого объекта=>присвоить сигнатуре какой-либо яркий цвет, =>в редакторе сигнатур Feature > Masking > Image to Feature Space. В окне этой функции установите номер ПП-вьюера, в котором Вы хотите отобразить сигнатуру, => Apply=>значения пикселей выбранного объекта отобразятся в ПП-вьюере цветом, присвоенным его сигнатуре.

2.Обратный анализ

блок Classifier=>Signature Editor. В открывшемся новом окне редактора сигнатур из меню Feature > View > Linked Cursor=>Указать номер ПП-вьюера => Link. Появится сообщение с просьбой указать привязываемое изображение. Щелкните курсором на изображении tm_86516.img. На изображении появится перекрестье, которое будет перемещаться одновременно с перекрестьем в ПП-вьюере и показывать положение пикселя в проективной плоскости ПП.

 

5. Общие принципы автоматизированной обработки многозональной (многослойной) видеоинформации. Понятие спектральной сигнатуры. Пространство спектральных признаков, его представление в пакете ERDAS Imagine.

Автоматизированная(неконтролируемая)обработка мнозозон-ой видеоинф-ии

-Если нет опыта тематической обработке МИ

- заранее известно общее количество классов и типичные для них характеристики образов

Возможность: быстрая оценка, сколько классов разделяется по спектральным характеристикам наиболее надежно и где они содредоточены на из-ии

На 1 этапе вып-ся нек-ая класс-я на большое количество классов и проводится анализ получ-ого результата. Те классы, которые,, соот-ют реальным тем-им объектам, оставляются, остальные, распр-ся по изобр-ию случайным образом, либо объед-ся с уже отобранными классами по близости их спектральных характ-к и относ-му распол-ю на из-ии, либо группируются так, чтобы получить еще какие-то интерпретируемые объекты.

В основе всех алгоритмов этого класса лежит метод кластеризации при заданном количестве групп

Аналогично,кому кажется вопрос не развернутым посмотрите вопрос №7

Спектральная сигнатура пикселя- соответствующий ему вектор (1) значений пикселя по слоям (спектральным диапазонам).

Сигнатура класса- вся совокупность типичных для данного класса n-мерных векторов (1) (для многозональных изображений - спектральных яркостей).

Используя признаковое пространство, можно определить:

• какие каналы наиболее полно отображают представленные на изображении тематические классы;

• где в признаковом пространстве расположены спектральные сигнатуры интересующих аналитика тематических категорий и какие классы будут разделяться наиболее надежно.

Пространство спектральных признаков:

-для каждого из-я будет своя характеристическая диаграмма рассеивания векторов.

Проекция рассеивания:

Диаграмма может сказать:

Широкая- в этой паре каналов большое кол-во разл.областей=>больше классов => информативная

Характерны для типов:

В большинстве пакетов обработки многоз-ые из-я, независимо от количества каналов, представляются RGB-комбинацией трех каналов: зеленого(0.5 - 0.6 мкм), красного (0.6 - 0.7 мкм) и ближнего (отражательного) ИК (0.7 - 0.8 или 0.8-0.9 мкм), причем эти каналы располагаются при RGB-синтезе в обратном порядке.

В результате RGB-синтеза растительность красная (самая высок отраж-ая способность в ближнем ИК-диапазоне), вода - голубовато-черная или зеленовато-черная (низкая интегральная отраж-ая способность по всем данным диапазонам), сухая почва и искусственные объекты - светло-голубой (наиб высокая интегральная отр-ая спос-ть по всем указанным диапазонам).

Задачи распознавания образа:

Образ класса-спектральная сигнатура пикселя

вектор состоит из нескольких значений

Х значения дают значения векторов яркости, рассматриваем образ как точку ПП.

 

6. Методы и средства анализа спектральных сигнатур дешифрируемых объектов в признаковом пространстве. Процедуры пакета ERDAS Imagine, обеспечивающие взаимосвязь признакового пространства с анализируемым изображением.

Cигнатуры объектов, которые визуально кажутся однородными, могут иметь значительный разброс по яркости. Этот факт - одна из причин ошибок, возникающих при классификации с обучением по тестовым участкам.

По-настоящему однородные по яркости сигнатуры можно получить, выбирая области непосредственно в признаковом пространстве. Для этой цели выберите одно из наиболее информативных сочетаний каналов, например, 3 и 4, и откройте в соответствующем ПП-вьюере AOI-инструментарий командой меню AOI> Tools. Он позволяет создавать области интереса в любом растровом вьюере, как на самом изображении, так и в его признаковом пространстве.

Создание сигнатур классов в признаковом пространстве.

Перемещая перекрестье на изображении=>определить примерное положение нескольких тематических классов в выбранных ПП-вьюерах=>нарисовать с помощью инструментов AOI соответствующие им многоугольники или эллипсы

(не выбирайте слишком маленькие участки в сине-фиолетовой зоне, и слишком большие - в красно-оранжевой)

Выделив нужную область в ПП-вьюере и добавить ее сигнатуру в редактор сигнатур=> выберать в редакторе функцию меню Feature > Statistics(для подсчета статистических характеристик сигнатуры).

Чтобы посмотреть, куда попадает сформированная сигнатура на изображении, установите для нее яркий цвет и выберите в меню редактора сигнатур функцию Feature > Masking > Feature Space to Image. Нажмите Apply.Пиксели, которые попадают по всем значениям внутрь выбранной Вами области в ПП-вьюере, будут подсвечены на изображении ее цветом

Посмотреть, какие пиксели попадают в диапазон значений данной сигнатуры по каналам (гиперпараллелепипед), выберите в меню редактора сигнатур функцию View > Image Alarm=> ОК. Пиксели, которые попадают в пределы разброса значений Вашей сигнатуры по каналам, будут подсвечены на изображении ее цветом.

Точки, находящиеся внутри заданного эллипсоида рассеяния=>в окне Image Alarmкнопка Edit Parallelepiped Limits=> Set,укажите в еще одном открывшемся окне радиокнопку Std. deviationи установите нужное значение ст=> получите все точки гиперэллипсоида рассеяния, соответствующего среднему значению и ковариационной матрице данной сигнатуры.

 

Признаковое пространство=>можно построить тематическое признаковое пространство

 

7. Общая характеристика методов автоматической классификации многозональных (многослойных) изображений. Понятия образа и класса. Контролируемая и неконтролируемая классификация. Обоснование применения каждого из этих подходов.

Ежели недостаточно смотри вопросы 7 и 10 ОБРАЗ-это описание объекта или процесса, позволяющее выделять его из окружающей среды и группировать с др объектами или процессами для принятия наобходимых решений. Те категории объектов, кот.мы хотим выделить или на которые хотим разделить все множество образов в процессе распознавания, обычно называют КЛАССАМИ. КОНТРОЛИРУЕМАЯ КЛАССИФИКАЦИЯ применяется в тех случаях, когда информации слишком много для того, чтобы точно определить, сколько всего классов можно выделить на анализируемом объеме данных. Поэтому мы выбираем только те классы, которые представляют интерес для решения задачи, и определяем их типичные характеристики с помощью процедур обучения.

НЕКОНТРОЛИРУЕМАЯ КЛАССИФИКАЦИЯ

Применяется в случаях:

-Если нет опыта тематической обработке МИ

- заранее известно общее количество классов и типичные для них характеристики образов

Возможность:быстрая оценка, сколько классов разделяется по спектральным характеристикам наиболее надежно и где они содредоточены на из-ии

 

8. Неконтролируемая классификация, ее назначение. Теоретические основы алгоритма (метод К средних). Особенности реализации метода в ERDAS Imagine. Входные параметры данной процедуры классификации. Способ отображения результата в пространстве признаков.

Автоматизированная(неконтролируемая)обработка мнозозон-ой видеоинф-ии

-Если нет опыта тематической обработке МИ

- заранее известно общее количество классов и типичные для них характеристики образов

Возможность: быстрая оценка, сколько классов разделяется по спектральным характеристикам наиболее надежно и где они содредоточены на из-ии

На 1 этапе вып-ся нек-ая класс-я на большое количество классов и проводится анализ получ-ого результата. Те классы, которые,, соот-ют реальным тем-им объектам, оставляются, остальные, распр-ся по изобр-ию случайным образом, либо объед-ся с уже отобранными классами по близости их спектральных характ-к и относ-му распол-ю на из-ии, либо группируются так, чтобы получить еще какие-то интерпретируемые объекты.

Метод неконтролируемой классификации

Алгоритм К средних- метод кластеризации при заданном количестве групп(дробление и слияние пустых кластеров), лежащий в основе всех алгоритмов класса ISODATA(алгоритм кластерного анализа класса).

Входные данные- К центры кластеров, которые в плотных компактных кластерах должны совпадать с выборочными средними по группе.

Шаг итерации базового алгоритма К средних включает: 1) группировку всех точек в кластеры по минимуму расстояния до текущих центров; 2) расчет новых центров как выборочных средних по каждому кластеру. Процедура выполняется до тех пор, пока кластеры и их центры не «стабилизируются». В результате этого процесса минимизируется средний внутригрупповой разброс и максимизируется среднее расстояние между центрами кластеров.

В ERDAS Imagine - алгоритм Форджи: качество результата оценивается по проценту точек, не перемещающихся из класса в класс в результате очередной итерации (параметр convergence threshold).

Задается два входных параметра: число кластеров и количество итераций, можно обрабатывать даже не каждый пиксель, задавая Skip factorпо строке и столбцу изображения (X и Y=> еще более грубая прикидка положения кластеров, и вряд ли имеет смысл использовать эти параметры на небольших объемах информации.

Недостатком предлагаемой реализации -линейная схема задания исходных центров кластеров по статистке изображения (рис.5).

 

 

Обработчику предлагается только два варианта:

1.по направлению наибольшего рассеяния точек в признаковом пространстве (так называемой главной компоненте).

Алгоритм К средних обеспечивает сходимость только к локальным максимумам гистограммы изображения=> результат будет зависеть от начального положения центров кластеров=>максимизация среднего разброса между центрами кластеров приводит к их расположению вдоль главной компоненты, то есть по направлению наибольшего разброса сигнатур пикселей. Поэтому один из предлагаемых способов задания центров (по главной компоненте) фактически сводит к минимуму сам итерационный процесс: кластеры почти не смещаются=>недостаточно эффективен.

2.равномерное расположение исходных центров на диагонали гиперкуба, образуемого осями координат пространства признаков

вариант выбора исходных центров самим обработчиком.

В ERDAS Imagine - в окне функции неконтролируемой классификации режим Signature Means и задать собственный входной файл сигнатур. Однако и в этом случае количество классов не регулируется в процессе кластеризации и всегда соответствует исходному количеству. Поэтому весь эффект кластеризации сводится к поиску ближайших к Вашим сигнатурам областей сгущения точек в признаковом пространстве (локальных пиков многомерной гистограммы => несколько лучший результат, чем при обычной классификации по минимуму расстояния, но только в том случае, если классы действительно однородны по яркости.

Количество разделяющихся интерпретируемых классов можно увеличить, задавая большее количество исходных центров, но некоторые классы, даже относительно однородные, разделить неконтролируемой процедурой не всегда удается. Пример такого класса как раз и показан выше на рис.4.

Чем больше размерность признакового пространства, тем больше классов нужно задавать для получения приемлемого по качеству результата=> наилучший результат неконтролируемая классификация дает на 2-4 наиболее информативных слоях.

Выполнение неконтролируемой классификации и предварительный анализ результата (способы отображения резултатов в пространстве признаков.).

анализ ПП-вьюеров =>выбор наиболее информативный набор из трех каналов,например:- 2-й, 3-й и 4-й. Кластеризацию будем проводить на данном трехмерном подмножестве исходного семимерного изображения. Это подмножество нужно предварительно создать с помощью функции Subset Imageблока DataPrep.

-Входное изображение будет tmJ360516.img,

-выходное изображение откройте в собственной папке под своим именем.

-задать через запятую список выбранных каналов: 2,3,4

-после завершения процесса открыть сформ-ое из-е в новом вьюере.

- функцияUnsupervised Classificationиз блока Classifier

-в качестве входного задать имя нового изображения.

-открыть файл для записи растрового результата классификации в рабочей папке.

-в соседнем окне открыть с тем же именем еще один файл, для сигнатур классов, которые будут получены в процессе кластеризации. Число классов задайте в интервале от 20 до 30. Выберите кнопку Color Scheme Options и задайте режим Approximate True Color, чтобы растровый результат кластеризации отображался в псевдоцветах исходного изображения.

-Кнопка Initialized Options позволяет выбрать одну из схем формирования исходных центров, описанных выше. По умолчанию используется диагональ гиперкуба.

-запустить процесс

-после завершения откройте растровый результат классификации в окне исходного изображения, не удаляя исходное ( указав в диалоговом окне ввода полученный в результате кластеризации файл, перейти в закладку Raster Options, отключить опцию Clear Display =>ОК)

 

 

-в окне изображения функцию Raster > Attribute.

- в открывшейся таблице атрибутов классов найдите поле Opacity. Присвойте этому полю значение 0 с помощью калькулятора функции меню Edit > Formula. Ваш результат классификации после присвоения полю Opacity значения 0 станет прозрачным. Теперь, выбрав яркий цвет для любого класса в поле Color и присвоив этому классу значение Opacity =1, Вы можете посмотреть, куда ложится выбранный класс на изображении. Так же можно просмотреть и любую выбранную группу классов. Выбор группы строктаблицы производится в крайнем левом (сером) поле с нажатием клавиши Shift. Для отмены выделения щелкните правой кнопкой на этом поле и в открывшемся меню выберите Select None.

Общая схема алгоритма ISODATA. Параметры настройки алгоритма. Процедуры дробления и слияния кластеров. Ограничения метода, реализованного в пакете ERDAS Imagine. Зависимость результата кластеризации от положения исходных центров кластеров.

ISODTA-интерактивный самореализующийся метод кластерного анализа данных.

См Метод неконтролируемой классификации из вопроса №7

Слияние классов:

1. , наиболее удобный в тех случаях, когда Вас вполне устраивают границы между классами на растровом результате классификации

- функция Raster > Reeode из меню вьюера изображения.

-Выберите предварительно классы, которые хотите объединить, и номер «базового» класса для этой группы. Номера классов можно просматривать на растровом результате классификации с помощью кнопки «+»

 

-Выбрав «базовые» классы, открыть окно функции Raster > Recode. В поле New Value заменить номера всех классов выбранной группы на номер «базового» класса => Apply. Все выбранные классы на изображении теперь принадлежат к «базовому» и имеют его цвет.

2. объединение сигнатур с помощью кнопки =U (или функции Edit > Merge) и повторная классификация.

-Объединенные сигнатуры будут добавляться как новые в уже имеющийся набор.

-Объединяемые классы не обязательно удалять.

-Из редактора сигнатур можно выполнять классификацию по любому выделенному набору сигнатур: выделить необходимые строки таблицы и вызовать функцию Classify > Supervised. В строке Parametric rule установите какое-либо правило классификации и откройте новый файл для формирования растрового результата.

На рис.8(а) показан результат простой перекодировки и положение границ шести классов в проективной плоскости 2,3 признакового пространства (каналы 3,4 исходного изображения). На рис. 8 (б), (в) -результаты контролируемой классификации по шести объединенным сигнатурам и соответствующие границы классов в этой же проекции пространства признаков. Вариант (б) - результат классификации по минимуму расстояния, (в) - гиперпараллелепипеды+максимум правдоподобия.

 

(в) в целом ближе к результату перекодировки (а), что заметно и на показанном участке классифицированного изображения. Однако на варианте (б) значительно точнее выделяется вода и немного точнее - почвы и застройка без зелени. Отсюда ясно, что метод группировки классов должен выбираться в соответствии с целями поставленной задачи и требованиями к точности выделения конкретных тематических классов.

Дробление классов:

-если маленькие классы(мало точек внутри)

Точке m3(2) соответсвуе ασ3(1)

Точке m2(1) соответсвуе ασ1(2)

σ-среднее отклонение

m-среднее значение

1. Вводим новые классы

2. определить пороговое значение, цвет которого σ (разброс больше среднего по все классам)

3. считаем разброс по каждому каналу=> берем кластер у каждого разброса

1-будем дробить по х1

3 будем дробить по х1

Как это делается:

-выбирается α меньше единицы

-откладываем вверх и вниз величину ασ1(2) (2)-координата

-образуется 2 новых центра

-7 кластеров-пересчитаем точки

-6 кластер лишний=>сливаем до нужного количества

Как это делать:

-выбрать центр слияния(maxрасстояние при котором мы можм объединить кластеры)

-определить сколько пар надо объединить=>выбирают самые маленькие=>объединение начнается слева

Результат:

-переиндексируем

-подсчитывем новые центры

-проверить,не образовались ли мал. Кластеры,пересчет центров,дробление-слияниеитд

Выскочит из алгоритма нужно,когда образуется нужное кол-во класткров и центров.

Интерпретация результатов неконтролируемой классификации с использованием спектральных сигнатур выделенных классов. Способы объединения выделенных классов в требуемые тематические категории, их реализации в ERDAS Imagine.

Чтобы более точно выполнить классификацию с обучением в двухэтапной схеме классификации, можно воспользоваться еще одним инструментом ERDAS Imagine - «тематическим» признаковым пространством.

- необходимо создать проективные плоскости признакового пространства для того подмножества каналов, на котором проводили неконтролируемую классификацию.

-Все ПП-проекции теперь не обязательно открывать в вьюерах. Если в изображении-подмножестве каналам 1,2,3 соответствуют каналы 2,3,4 исходного изображения, открыть только ПП-проекцию для каналов 2,3 трехканального изображения (красный и ближний ИК), как наиболее информативную.

-вызвать из блока Classifierфункцию Feature Space Thematic.В окне этой функции задать:

1) имя растрового результата тематической классификации (Thematic Input File);

2) в окне Feature Space File- имя используемой ПП-проекции (в рассматриваемом случае каналы 2,3 изображения-подмножества);

3) в окне Output Root Nameпервые 2-3 буквы, которые будут идентифицировать результат тематической классификации.

-Последовательно задать остальные ПП-проекции в окне FeatureSpace File

-получить тематические ПП-файлы по всем парам каналов.

-Все формируемые файлы после ввода данных будут показаны в нижней таблице окна.

-Открыть созданную тематическую ПП-проекцию для наиболее информативной пары каналов в новом вьюере.

-Открыть в том же вьюере исходный ПП-файл, который задавали в окне 2 функции Feature Space

-Активным слоем считается верхний слой. Поэтому для получения статистик по AOI-объектам ПП-вьюеров необходимо, чтобы тематическое ПП-изображение находилось под основным.

-Открыть в редакторе сигнатур файл сигнатур, полученный в результате неконтролируемой классификации.

-Выполнить соединение ПП – вьюеров

-переключая слои можно увидеть не только положение точки в ГТГТ, но и ее относительное положение в соответствующем классе.

-Чтобы увидеть положение центров кластеров, выделить все сигнатуры и присвоить им черный цвет.

-фу-я Feature >Objects. В окне функции установите номер ПП-вьюера, отключить пока Plot Ellipse и отметьте галочкой Plot Means

-Центры кластеров будут показаны в ПП-вьюере черными крестиками (рис.9). Опции Plot Ellipse и Plot Rectangle покажут эллипсоиды рассеяния точек в кластерах и границы значений сигнатур кластеров по каналам.

Выводы:

-Положение центра показывает, в какой части кластера сосредоточено максимальное количество точек=>поможет определить, какие объекты на изображении являются типичными представителями классов, выделенных в результате неконтролируемой классификации.

-Для этих объектов подавляющая часть точек должна также быть сосредоточена вблизицентра кластера. Если такие объекты есть, можете смело формировать по ним обучающие выборки (сигнатуры). Это будут надежно выделяющиеся по спектральным признакам классы.

Если объекты одного типа включают в себя несколько классов, но ср знаяения приходятся на оин и тот же кластер:

-можно оставить сигнатуру центрального класса в качестве типичной. Возможно, что при повторной классификации другим методом с помощью этой сигнатуры результат окажется более точным.

Важные плюсы: во многих случаях сигнатуры кластеров оказываются более однородными, чем сигнатуры любых тестовых участков, выбранных непосредственно на изображении. Это, собственно, и является основным доводом в пользу двухэтапной схемы классификации. Большой разброс точек в сигнатурах, полученных в результате обучения по изображению, приводит к увеличению ошибок классификации.

Классификация с обучением, обоснование ее применения. Принципы выбора обучающих данных с учетом изменчивости яр костных признаков классов на изображении. Методы получения обучающих выборок (сигнатур классов) в пакете ERDAS Imagine.

Задача классификации заключается в разбиении признакового пространства на области, соответствующие различным тематическим категориям (классам) объектов земной поверхности.

Распознавание с обучением (контролируемая классификация) применяется в тех случаях, когдаинформации слишком много для того, чтобы точно определить, сколько всего классов можно выделить на анализируемом объеме данных. Поэтому мы выбираем только те классы, которые представляют интерес для решения задачи, и определяем их типичные характеристики с помощью процедур обучения.

Выбирать обучающие данные можно двумя способами. Можно выделять интересующие нас объекты или их участки (участок воды, леса, застройки и пр.) непосредственно на изображении или в пространстве признаков. Перед тем, как это делать, нужно связать изображение с пространством признаков в Эрдасе.

При выборе на изображении, откройте в окне изображения инструментарий для рисования областей интереса AOI > Tools. С помощью инструмента & оконтурите небольшой объект на изображении. Добавьте в редактор сигнатур сигнатуру выбранного объекта с помощью кнопки . Присвойте сигнатуре какой-либо яркий цвет, например, белый. Выберите в редакторе сигнатур функцию Feature > Masking > Image to Feature Space. В окне этой функции установите номер ПП-вьюера, в котором Вы хотите отобразить сигнатуру, и нажмите Apply. Значения пикселей выбранного объекта отобразятся в ПП-вьюере цветом, присвоенным Вами его сигнатуре. В результате может получиться так, что выделится не какая-то единая область, а очень много разрозненных участочков. Т.е.сигнатуры объектов, которые визуально кажутся однородными, могут иметь значительный разброс по яркости. Этот факт - одна из причин ошибок, возникающих при классификации с обучением по тестовым участкам.

Создание сигнатур классов в ПП. По-настоящему однородные по яркости сигнатуры можно получить, выбирая области непосредственно в признаковом пространстве. Для этой цели выберите одно из наиболее информативных сочетаний каналов, например, 3 и 4, и откройте в соответствующем ПП-вьюере AOI-инструментарий командой меню AOI > Tools. Определите, перемещая перекрестье на изображении, примерное положение нескольких тематических классов в выбранных ПП-вьюерах и нарисуйте с помощью инструментов AOI соответствующие им многоугольники или эллипсы. Особенно рекомендуется обратить внимание на яркие пятна, соответствующие классам воды. Более точно выделить эти классы, обучаясь непосредственно по изображению, едва ли удастся каким-либо другим способом. Не выбирайте слишком маленькие участки в сине-фиолетовой зоне, и слишком большие - в красно-оранжевой.

Выделите нужную область в ПП-вьюере и добавьте ее сигнатуру в редактор сигнатур. После этого выберите в редакторе функцию меню Feature > Statisticsдля подсчета статистических характеристик сигнатуры.

Чтобы посмотреть, куда попадает сформированная сигнатура на изображении, установите для нее яркий цвет и выберите в меню редактора сигнатур функцию Feature > Masking > Feature Space to Image. Нажмите Apply.Пиксели, которые попадают по всем значениям внутрь выбранной Вами области в ПП-вьюере, будут подсвечены на изображении ее цветом.

Сигнатуры можно строить в любом из присоединенных к изображению ПП-вьюеров, выбирая тот, в котором Вашему классу соответствует более компактная, отличная от других область(в котором более широкая диаграмма рассеяния).

Чтоб посмотреть, какие пиксели попадают в диапазон значений данной сигнатуры по каналам (гиперпараллелепипед), выберите в меню редактора сигнатур функцию View > Image Alarm.В открывшемся окошке нажмите ОК. Пиксели, которые попадают в пределы разброса значений Вашей сигнатуры по каналам, будут подсвечены на изображении ее цветом.

Точки, находящиеся внутри заданного эллипсоида рассеяния, можно получить, нажав в окне Image Alarmкнопку Edit Parallelepiped Limits.В этом окне нажмите Set,укажите в еще одном открывшемся окне радиокнопку Std. deviationи установите нужное значение ст.

Параметрические и непараметрические методы классификации с обучением в ERDAS Imagine. Метод гиперпараллелепипедов и классификация по сигнатурам, выбранным в пространстве признаков. Классификация по минимуму расстояния. Способы классификации точек, попавших за границы класса или в область перекрытия нескольких классов.

Задача классификации заключается в разбиении признакового пространства на области, соответствующие различным тематическим категориям (классам) объектов земной поверхности.

Распознавание с обучением (контролируемая классификация) применяется в тех случаях, когдаинформации слишком много для того, чтобы точно определить, сколько всего классов можно выделить на анализируемом объеме данных. Поэтому мы выбираем только те классы, которые представляют интерес для решения задачи, и определяем их типичные характеристики с помощью процедур обучения.

Откройте функцию Supervised Classificationблока Classifier. В нижней части окна устанавливается метод классификации - непараметрическое правило (Non-parametric Rule)и параметрическое правило (Parametric Rule).При классификации по непараметрическому правилу к одному классу будут относиться все точки, попавшие либо внутрь гиперпараллелепипеда (режим Parallelepiped в Non-parametric Rule),либо в область, выделенную в ПП-вьюере (режим Feature Spaceв Non-parametric Rule).

Метод гиперпараллелепипеда Значения признаков для образов различных классов могут совпадать или перекрываться по одним координатам и различаться по другим. Если выбрать такой набор признаков, чтобы образы разных классов различались хотя бы по одной координате, мы можем задать простое правило классификации:

(5.1)

где Ω j (к) - интервал значений признака xj, для класса Ак. Геометрическая интерпретация этого случая при п=2, К=3 показана на рис. 5.1.

На рис. 5.1 Ω1(l)=Ω1(2)+Ω1(3), но класс A1 разделяется попарно с классами А2 и А3 по признаку х2. В то же время Ω2(2)=Ω2(3), но эти классы разделяются по признаку х1

Рис.5 Л. Простой случай разделения классов (гиперпараллелепипеды).

Классификация по сигнатурам выбранным в ПП – см. вопр.10. Если коротко – строим ПП для наиболее информативной пары каналов, связываем это ПП с изображением. Перемещая перекрестье приблизительно находим какая область в ПП каким объектам соответств. И после этого вручную отрисовываем области в ПП, т. е. сами создаем сигнатуры классов.

При классификации по параметрическому правилу используются определенные статитстические характеристики сигнатуры. Обычно это мк - среднее по сигнатуре к-го класса 9центр кластера) и ковариационная матрица.

В классификации по минимуму расстояния {режим Minimum Distance в Parametric Rule) в качестве критерия классификации используется евклидово расстояние классифицируемой точки в ПП до центров кластеров. Это простейшее из параметрических правил. В этом случае граница между парой классов - это серединный перпендикуляр к прямой, соединяющей их центры.

Два другие режима используют и среднее, и матрицу ковариаций. В обоих случаях предполагается, что значения признаков по классам распределены по нормальному (Гауссову) закону. Плотность многомерного нормального распределения имеет вид

В случае, когда все ПП статистически независимы, матрица Ск диагональна и расстояние Махаланобиса приобретает достаточно простой вид:

В этом случае оси гиперэллипсоида будут параллельны осям координат признакового пространства. Статистическая независимость признаков, то есть координат многомерного вектора, для всей совокупности выделяемых классов далеко не всегда имеет место. Это хорошо видно на рис.10, где вообще нет ни одного эллипса, оси которого расположены горизонтально и вертикально. В такой ситуации как раз и удобно использовать расстояние Махаланобиса. Точка будет относиться к тому классу, для которого она, грубо говоря, окажется внутри гиперэллипсоида рассеяния меньшего размера.Классификация по расстоянию Махаланобиса более эффективна в случае различной корреляции признаков внутри классов. Если внутригрупповая корреляция приблизительно одинакова для всех выделяемых классов (эллипсоиды вытянуты в одном направлении), можно пользоваться классификацией по евклидову расстоянию. Эта ситуация встречается на изображениях, где представлены преимущественно объекты одной категории, например растительность или почвы.

Классификация по максимуму правдоподобия (режим Maksimum Likelihood в Parametric Rule) иначе называют байесовским решающим правилом. В этом подходе используется вероятность появления каждого класса Ωkдля точки с заданным набором значений признака xi, которая определяется по формуле:

p(Ωk/ xi)=(P(Ωk) p(xi /Ωk))/ (∑P(Ωj) p(xi /Ωj))

Выбирается тот класс, для которого эта вероятность максимальна. Кроме того здесь используется вероятность появления такого класса на данной территории р(Пк) - априорная вероятность класса.Она определенным образом масштабирует вероятность появления точки в классе относительно таких же вероятностей для других классов, что приводит к смещению разделяющих границ. Однако на практике этим пользуются редко. Чаще априорные вероятности считают одинаковыми (так называемая нуль-единичная байесовская стратегия).

При использовании гипотезы о нормальном распределении значений признаков метод максимума правдоподобия отличается от классификации по расстоянию Махаланобиса только наличием априорных вероятностей появления классов в соответствии с формулой Байеса.

В случае, если признак х распределен в классе 1 и в классе 2 по нормальному закону, области решения в пользу каждого из классов определены разделяющей точкой х0. Слева от х0 решение принимается в пользу класса 1, справа - в пользу класса 2.

При использовании метода гиперпараллелепипеда нужно решить, куда и как относить те точки, которые не попадают ни в какой гиперпараллелепипед.

В окне функции Supervised Classification для этого случая нужно задать режим Unclassified Rule. Как Вы уже, вероятно, поняли, важное различие между непараметрическими и параметрическими правилами состоит в том, что если в первом случае область принятия решения в пользу каждого класса строго ограничена, то во втором она ограничена только разделяющими функциями dki(x) для каждой пары классов Ак и Аi То есть все точки будут, так или иначе, расклассифицированы, независимо от того, попадают они или нет в гиперпараллелепипед или эллипсоид рассеяния какого-то класса.

При использовании метода максимума правдоподобия существует опасность, что все точки, находящиеся на краях диаграммы рассеяния в пространстве признаков, попадут в класс с наибольшей дисперсией, хотя могут не иметь к нему никакого отношения, Такая ситуация для одномерного случая показана на рис. 20. Вряд ли ТОЧКИ В левом полуинтервале будут на самом деле относиться к классу 3, если и качестве признаков используются спектральные отражательные свойства объектов земной поверхности. На практике ЭТО иногда приводит к результатам, на первый взгляд, парадоксальным: очень сухие ПОЧВЫ и яркие искусственные объекты смешиваются с мутной водой. По если вспомнить, где расположены эти классы в пространстве спектральных признаков, ЭТОТ эффект объясняется довольно просто.

10.

На случай, если гиперпараллелепипеды классов все-таки где-то перекрываются, необходимо задать правило принятия решения при перекрытии (Overlap Rule). Для этого случая расстояние Махаланобиса, как и максимум правдоподобия, практически всегда оказываются эффективными. Для максимума правдоподобия можно также задать априорные вероятности (поле Ргоь. в редакторе сигнатур), чтобы нужным образом сдвинуть границы между классами. При классификации в этом случае нужно указать режим Use Probabilities.

В качестве правила классификации при перекрытии можно также задать свои собственные приоритеты классов (поле Order в редакторе сигнатур). В этом случае при перекрытии гиперпараллелепипедов (или, соответственно, областей в признаковом пространстве для непараметрического правила Feature Space) пиксель будет относится к тому классу, приоритет которого выше. Например, при перекрытии классов 2 и 5 точка будет отнесена к классу 2.

Статистическая классификация. Обоснование метода на примере двух классов и одного признака. Ошибки первого и второго рода. Определение границ классов через минимум среднего байесовского риска.

Часто встречаются ситуации, когда один и тот же образ может принадлежать сразу нескольким классам, но частота появления образа с конкретным значением для различных классов не одинакова и определить оптимальную границу между классами можно только с учетом этого факта. При обработке изображений относительную частоту появления образа в классе можно оценить, построив гистограмму по объектам, принадлежащим заданному классу. При большом количестве образов в k-м классе эта частота стремится к вероятности Pk(x) появления образа х в данном классе, и гистограмму можно рассматривать как дискретную аппроксимацию функции плотности распределения fk(x).

Принцип максимума правдоподобия. Эти алгоритмы основаны на статистическом подходе к задаче распознавания и представляют собой классификаторы с обучением. То есть предполагается, что

1) заданы определенные классы и по ним имеются данные предварительных исследований (тестовые участки при обработке данных ДЗ);

2) эти данные позволяют получить представительные выборки образов по всем классам и оценить вероятность появления образа в каждом классе для всего множества X.

Рассмотрим правила принятия решений в задаче статистической классификации на примере двух классов и одного признака, заданного действительным значением измерения X. Задача заключается в определении на шкале X интервалов Ω1 и Ω2, на которых будут приниматься решения в пользу первого и второго класса соответственно. Для простоты в дальнейшем классы и соответствующие им области принятия решения будем обозначать одним и тем же символом Ω.

Предположим, что получена вся необходимая статистическая информация о классах: функции плотности статистического распределения f1(x) и f2(x) (рис.8.1), а так же априорные вероятности P(Ω1) и Р(Ω2) появления данных классов. Для задачи обработки данных ДЗ априорные вероятности - это ожидаемые доли площади под каждым классом, которые могут быть получены, например, из фондовых материалов.

Пусть мы выбрали некоторую точку х0, разделяющую всю шкалу значений признака х на два интервала: (-∞,х0] соответствует области решений в пользу класса Ω1, (хо,∞) - области решений в пользу класса Ω2. В теории статистических решений непротиворечивое множество предположений о свойствах случайной величины ξ, называется статистической гипотезой. В данном случае мы рассматриваем две статистические гипотезы: ξ, принимающая значения х, имеет распределение с плотностью f1(x), то есть принадлежит классу Ω1 - это гипотеза H1 против альтернативы Н2: ξ имеет распределение с плотностью f2(x), то есть принадлежит классу Ωг.

Рис.8.1. Статистическая гипотеза для случая двух классов.

Вероятность появления любого значения х отлична от нуля и для первого, и для второго класса на всем множестве X, поэтому при принятии решения относительно принадлежности некоторого значения х к одному из классов могут возникнуть 4 ситуации.

1. Принимаем гипотезу Н1 и она верна.

2. Принимаем Н2, но верна H1 .

3. Принимаем Н2, и она верна.

4. Принимаем Н1 но верна Н2.

Вероятность возникновения ситуации 1 соответствует площади под f1(x) на полуинтервале (-∞,х0], ситуации 2 - площади под f1(x) на интервале (хо,∞), ситуации 3 - площади под f2(x) на (хо,∞), ситуации 4 - площади под f2(x) на (-∞,Хо]- Суммарная площадь под f1(x) и f2(x) для ситуаций 2 и 4- это полная вероятность ошибокв нашей схеме принятия решений. В случае двух альтернативных гипотез ошибку, соответствующую ситуации 2, обычно называют ошибкой первого рода(а), ошибку, соответствующую ситуации 4, - ошибкой второго рода(|3). Вообще говоря, понятие ошибок первого и второго рода симметрично и зависит от того, какая гипотеза является основной, а какая - альтернативной. Если бы H2 была основной гипотезой, ошибка первого рода соответствовала бы ситуации 4.

При классификации пикселов многозональных аэрокосмических изображений ошибка первого рода проявляется в появлении на объектах класса Ω1 точек посторонних классов. В свою очередь, ошибки второго рода проявляются в появлении точек этого класса на других объектах. Когда количество классов невелико, обычно преобладают ошибки второго рода. Это связано с тем, что аналитик не учитывает все присутствующие на изображении типы объектов, в том числе и с характеристиками, близкими к выделяемым классам. Это одна из причин, по которой полезно выполнение предварительной неконтролируемой классификации, причем на значительно большее, чем требуется, количество классов. Неконтролируемая классификация позволяет предварительно оценить величину ошибок второго рода, более точно определить границы искомых классов и, при необходимости, разумно задать класс отказов от распознавания.

Про Баеса см. зел. методичку стр.52 Там матрица и интегралы.

Статистическая классификация в случае произвольного числа классов. Формула Байеса, функция правдоподобия и апостериорная вероятность. Принцип максимума правдоподобия, его реализация в пакете ERDAS Imagine. Матрица ошибок.

Пусть теперь задано К классов Ω1...,ΩK с функциями плотности распределения признака х f1(x),...,fK(x) и априорными вероятностями P(Ω1),...,P(Ωk). К примеру, мы хотим разбить на К классов точки серого полутонового изображения по значениям яркости х. Гистограмма такого изображения, нормированная к общему количеству точек S0, представляет собой дискретную аппроксимацию плотности р(х) совместного распределения точек К классов. Рассмотрим, что представляет из себя значение р(х) в отдельно взятой точке X;.

Как мы уже отметили при записи среднего байесовского риска, вероятность появления точки со значением Xj в k-м классе есть произведение вероятностей P(Ωk) fk(Ωj), или, иначе, Р(Ωк)р(хΩк). Плотность совместного распределения в точке хi - полная вероятность появления значения xi - есть

Общую долю k-го класса в этой сумме, то есть вероятность

того, что точка со значением Xi принадлежит именно k-му классу, тогда можно записать так

В теории вероятностей формулу (8.10) называют формулой Байеса для полной системы несовместных событий. В нашем случае такую систему образуют решения об отнесении точки со значением хi к одному из К классов.

В отличие от априорной вероятности Р(Ωк), которая характеризует ожидаемую частоту появления k-го класса по множеству образов в целом, p(Ωk/Xi) - это вероятность появления k-ro класса при конкретном значении признака х. Эту вероятность называют апостериорной вероятностью.

Поскольку P(Ωk)p(x/Qk)=P(Ωk)fk(x) (величину P(Ωk)p(x/Ωk) часто называют функцией правдоподобия), а знаменатели в выражении (8.10) одинаковы для всех К классов, мы можем для любой пары классов к и s записать отношение правдоподобия (8.6) через апостериорные вероятности

В соответствии с байесовской стратегией, решение принимается в пользу того класса, для которого Lks(x)>λ (Lks(х)>1 при C12==c21=l; в принципе, мы всегда можем выполнить соответствующую нормировку, чтобы это условие выполнялось. Следовательно, образ с конкретным значением признака х мы должны отнести к тому из К классов, для которого p(Ωk /x)> p(Ωs /x) или, что эквивалентно, Р(Ωк)р(х/Ωk)>Р(Ωs)р(х/Ωs)) по всем парам k,s. Отсюда и название данного подхода - принцип максимума правдоподобия.

Часто при классификации по максимуму правдоподобия априорные вероятности появления всех классов считаются одинаковыми, а платежные коэффициенты принимаются равными 0 и 1, как мы это делали ранее. Классификацию при таких условиях называют нуль-единичной байесовской стратегией. Вэтом случае мы сокращаем ошибку первого рода для маловероятных классов, что позволяет выделять их более надежно.»

Тем не менее, для ряда задач априорные вероятности могут иметь важное значение. Например, при дистанционном мониторинге некоторой территории, на которой наблюдается определенное количество классов с известными р(х/Ωs). В этом случае в результате итеративного процесса классификации с априорными вероятностями Pi(Ωs)=Sj.i(A), где i -очередной шаг итерации, a Si-1(Ωs) - доля площади под классом Ωs, полученная на i-1-м шаге, можно получить наиболее близкие к истинным значения площадей под классами [28].

В Эрдасе максимум правдоподобия:

Для выбора решающего правила в первую очередь воспользуемся функцией редактора сигнатур Feature> Objects.Посмотрите, как располагаются гиперпараллелепипеды и эллипсоиды рассеяния Ваших сигнатур во всех проекциях признакового пространства. Если они не перекрываются, Вы можете использовать простейшее непараметрическое решающее правило гиперпараллелепипедов. Остается только решить