Технические средства ввода данных. Как отмечалось выше, необходимым компонентом ГИС является система ввода информации

Как отмечалось выше, необходимым компонентом ГИС является система ввода информации. Основным способом кодирования пространственных данных для ввода в ЭВМ является цифрование - перевод пространственных данных в цифровую форму. Возможны следующие способы:

Цифрование с помощью дигитайзера. Существует дигитализация по точкам; при этом оператор обводит курсором дигитайзера контура, нажимая при этом необходимые кнопки. При каждом нажатии в компьютер посылается код кнопки и координаты точки пересечения нитей курсора. Изображения обведенных линий появляются на экране монитора. При этом не требуется сложной аппаратуры и программного обеспечения, однако такой процесс достаточно трудоемкий, и ошибки со стороны оператора неизбежны. При цифровании потоком процесс аналогичен, только сигнал подается не при нажатии на клавиши курсора, а при пересечении курсором линий сетки планшета дигитайзера. Это избавляет оператора от необходимости постоянно нажимать на клавиши, зато нужно хранить большое количество, возможно, лишних координат, получающихся при пересечении линий сетки.

Цифрование растрового изображения на экране компьютера «по подложке» (векторизация). Эти методы требуют специализированного сложного программного обеспечения и мощной аппаратуры, т.к. для их реализации необходимо высокое быстродействие и большие объемы памяти. Отсканированное изображение из файла выводится на экран монитора, и само цифрование осуществляется по этой «подложке», обычно при помощи «мыши». В этом случае оператор также должен «обвести» каждый объект, только не на планшете, а на экране монитора. При ручной векторизации все операции выполняет сам оператор, а при интерактивной часть операций производится автоматически. Интерактивный векторизатор при задании начальной точки и направления отслеживания линий сам прорисовывает линию до тех пор, пока на его пути не встретится неопределенная ситуация (разветвление или разрыв линии). При этом оператор вмешивается в процесс , «помогает» программе разрешить неопределенность и векторизация продолжается до появления новой неопределенности. В основе метода лежит «умение» программы распознавать направление обхода объекта в его поточечном изображении. Большинство векторизаторов, работающих в интерактивном режиме, обладают возможностями настройки на преодоление некоторых неопределенных ситуаций, что позволяет векторизовать штриховые и штрихпунктирные линии, горизонтали с бергштрихами, бровки оврагов и т.д. Возможности интерактивной векторизации прямо связаны с качеством исходного материала и сложностью карты. Несмотря на трудоемкость эти способы позволяют добиться гораздо большей точности, чем при обычном цифровании дигитайзером, поскольку линии проводятся прямо по линиям, полученным со сканера, а изображение на экране может быть увеличено до необходимых размеров.

Автоматическое цифрование подразумевает небольшое по сравнению с предыдущими методами вмешательство оператора в работу системы. Карта вначале сканируется, а затем автоматически переводится в векторный формат. Этот тип ввода информации состоит из следующих этапов: предварительного редактирования, непосредственного перевода из растрового формата в векторный и окончательного редактирования. Некоторые программные продукты, реализующие этот метод (Profession Conversion Series фирмы GTX Corp), корректируют всевозможные помехи (пятна, грязь и т.д.) с использованием специальных программ. Окончательное редактирование обязательно проводится после перевода форматов, т.к. любая самая изощренная программа может неверно распознать объект, принять символ за группу точек, определить площадь как набор линий и т.п. Программы автоматического цифрования очень дороги, они удобны в том случае, когда постоянно обрабатывается большое количество однотипных чертежей или карт, содержащих линейные элементы. При этом методе цифрования отсутствуют проблемы «сшивки» соседних карт, такие программные продукты обычно работают в пакетном режиме, что еще более ускоряет процесс. Однако недостатки - ограниченное количество распознаваемых символов и шрифтов, трудности при необходимости векторизации только части растровой информации, - делают этот метод весьма время- и трудоемким.

Технологии ввода данных, основанные на применении этих устройств, являются альтернативными и конкурентными. Они обладают специфическими достоинствами и недостатками, их применение в каждом конкретном случае должно опираться на анализ комплекса факторов, что позволяет оценить возможную эффективность, трудозатраты, стоимость и точность цифрования данных. Также применяются устройства, основанные на иных принципах регистрации (например, приборы автоматического прослеживания линий).

Цифрователь используется для автоматизации процесса преобразования положения объектов на карте и регистрации их в прямоугольных координатах X, Y. Он подключен к ЭВМ параллельно с терминальным блоком для ввода графических данных, при этом результаты цифрования отображаются на терминальном печатающем устройстве. Примером терминала с разделением времени является графический терминал, где есть экран телевизионного типа, на который может выноситься изображение, а также имеется возможность обратной связи для изменения изображения, если требуется внесение поправок, что особенно важно при вводе данных.

Сканер считывает изображение в виде растровой картинки; преимущество устройств сканерного типа в том, что скорость и точность считывания у них по сравнению с полуавтоматическими цифрователями гораздо выше. Кроме того, построчное считывание упрощает засылку данных со сканерной системы в базы данных. Однако возникают серьезные трудности при необходимости внесения параллельно каких-либо дополнительных сведений в соответствующие ячейки базы данных.

Необходимо заметить, что пользователь становится частью ГИС всякий раз при выполнении сложного анализа, например, пространственного анализа или моделирования. Такие работы обычно требуют опыта в выборе инструментария из набора ГИС и хорошего знания используемых данных.

Модели данных

Двумя основными типами информации для ГИС являются пространственные и атрибутивные базы данных. Пространственная информация в ГИС может быть представлена в растровом или векторном виде.

Векторная модель – это координатная структура данных; она используется для представления информации, которая имеет объектную природу и нуждается в анализе и манипулировании. Пространственные объекты разделяется на множество атомарных, элементарных объектов - геометрических примитивов. К ним принадлежат точки (точечные объекты), линии (линейные объекты), контуры (ареалы, полигоны), поверхности (рельефы). Эти четыре примитива: нуль-, одно-, двух- и трехмерные пространственные объекты ориентированы на векторное представление, когда их описание осуществляется путем указания координат объектов и составляющих их частей. Например, каждый линейный объект представляется последовательностью координатных пар X, Y. В этом случае данные хранятся в виде точек и линий, связанных геометрически и математически. Эти связи означают, что информация может толковаться как серия индивидуальных точек или образовывать новые сложные структуры данных. При построении векторных моделей создаются целостные объекты путем соединения точек прямыми линиями, дугами окружностей, полилиниями. Атрибуты связываются с объектом (в отличие от растровой модели, где атрибуты связываются с ячейками сетки).

Наличие атрибутов позволяет интерпретировать информацию, которая хранится в сопутствующих базах данных, например, как тип почв, гидрологическую сеть или жилые строения.

Основные части векторной модели:

§ нуль-, одно-, двух- и трехмерные пространственные объекты (точки, линии, полигоны, поверхности);

§ атрибуты (признаки, связанные с объектами);

§ связи между объектами.

Растроваямодель данных получается, как фотография, в виде отдельных точек. В этом случае примитивами являются ячейки регулярных пространственных сетей и элементы разрешения изображений (пикселы). Это дискретная модель, в которой используется двухмерный элемент пространства – пиксел (ячейка). В растровых моделях дискретизация осуществляется путем отображения географических объектов в пространственные ячейки, образующие регулярную сеть. При этом каждой ячейке соответствует одинаковый по размерам, но разный по характеристикам (цвет, плотность) участок поверхности объекта. В ячейке модели содержится одно значение, усредняющее характеристику участка поверхности объекта. Основное назначение растровых моделей – непрерывное отображение поверхности, они дают информацию о том, что расположено в той или иной точке поверхности.

В качестве растровых изображений в ГИС обычно выступают снимки или растеризованные векторные изображения. Преимущество снимков - в их современности и достоверности, поэтому достаточно часто встречающийся вид анализа в этой группе - временной. Сравниваются и ищутся различия между снимками различной давности и таким образом оценивается динамика произошедших изменений. К снимкам может быть применен кластерный анализ, на основе которого производится классификация, выделяются области лесов, рек, полей и т.д.

Основное преимущество ячеистых представлений данных – слияние позиционной и семантической (смысловой) атрибутики растрового слоя в единой прямоугольной матрице, положение элементов которой определяется номером их столбца и строки (при необходимости координаты ячейки пространственной сети могут быть легко вычислены), а значение элемента является непосредственным указателем ее смыслового кода. Кроме того, с каждым смысловым кодом (в данном случае идентификатором) может быть связан неограниченный по длине набор атрибутов, каждый из которых может быть развернут в производный слой с размерностью исходной матрицы первичных смысловых кодов. Таким образом, становится не столь обязательным разделение данных на позиционную и семантическую составляющие, нет необходимости в особых средствах хранения и манипулирования семантикой пространственных данных, как это принято в векторных системах. Существенно упрощаются аналитические операции; обработка запросов с логическими условиями сводится к попиксельным операциям с пакетом растровых слоев.

В первых геоинформационных проектах использовалось ячеистое представление объектов путем их соотнесения с территориальными регулярными ячейками некоторых сетей. Территория разбивается на ячейки правильной геометрической формы (прямоугольной, квадратной, треугольной, гексагональной или трапецевидной) в некоторой системе координат (прямоугольной геодезической, географической или в условной прямоугольной системе координат карты). При этом сеть мысленно может строиться на плоскости, поверхности шара или эллипсоида (в последнем случае регулярными ячейками являются сферические трапеции заданного углового размера). Размеры ячеек могут быть различны и определяются требуемым пространственным разрешением. Если необходимо оперировать разным пространственным разрешением, можно применить системы вложенных друг в друга территориальных ячеек.

Представление данных на основе регулярных пространственных сетей образует основу цифровой модели рельефа Земли, содержащей более 8 млн. Высотных отметок в узлах регулярной сети сферических трапеций с размерами 5х5 минут.

Основные характеристики растровых моделей:

значение – элемент информации, хранящийся в элементе растра (пикселе);

ориентация – угол между направлением на север и положением колонок растра;

разрешение – минимальный линейный размер наименьшего участка пространства (поверхности), отображаемый одним пикселем. Более высоким разрешением обладает растр с меньшим размером ячеек. Высокое разрешение подразумевает обилие деталей, множество ячеек, мелкий размер ячейки.

Растр применяется в основном там, где пользователя не интересуют отдельные пространственные объекты, а интересует точка пространства как таковая с ее характеристиками (высотная отметка или глубина, влажность или тип почв, точка принадлежит дороге или вне ее и т.д.).

Для большинства ГИС-проектов требуется, чтобы данные были представлены в векторной форме, а растр используется в виде «подложки» или в качестве атрибута (иллюстрации). Например, таким образом может быть использована фотография или изображение примечательного здания.

В общем случае растровые данные, при достаточной простоте машинной реализации, плохо сжимаются и занимают в системе места больше, чем векторные с сопутствующей информацией. Для сжатия растровой информации используется метод «кодирования цвета» или «сжатия по столбцам». В первом случае используется тот факт, что при хранении последовательности пикселов одного цвета достаточно знать только его номер и количество пикселов и таким образом закодировать все изображение. При больших одноцветных площадях размер файла при таком сжатии может быть уменьшен в 5 раз.

При сжатии по столбцам выбирается базовый столбец пикселов, в соседнем столбце кодируются точки, отличающие его от базового столбца, при значительных отличиях он принимается за новую базу и т.д. Оба эти способа хороши для черно-белых изображений, но малоэффективны для серых и цветных.

Гораздо большей результативностью пользуется подход, получивший название квадротомического дерева. В квадротомических структурах, разбивающих территорию или изображение на вложенные ячейки, достигается значительная экономия памяти для хранения растровых данных и сокращается время доступа к элементам описания пространственных объектов. Эта особенность используется и при представлении квадротомическим деревом векторных структур.

Для представления трехмерных изображений используется аналогичная методика построения октотомических деревьев. Представление трехмерных объектов могут строиться на векторной модели путем векторного описания горизонталей или иных изолиний, представляющих поле рельефа. В случае растровой модели – в виде упорядоченной совокупности высотных отметок в узлах решетки.

Практика ГИС предложила также иные подходы представления поверхностей – треугольные нерегулярные сети, используемые, в частности, в ГИС ARC/INFO в модуле цифрового моделирования рельефа. В этом случае на множестве точек высотных отметок с координатами X, Y, Z и образуемым ими треугольников (триангуляция Делоне) строится треугольная сеть. К узлам треугольной сети, а также ребрам (сторонам треугольников) относятся далее все исходные и производные атрибуты цифровой модели рельефа.

Существуют также гибридные модели («вастерные»), сочетающие векторную и растровую модели. Обычно программные средства ГИС поддерживают несколько структур представления пространственных данных. Необходимость оперирования с растровыми и векторными представлениями, предполагая поддержку обеих моделей, обязывает иметь средства конвертирования данных из одного формата в другой. Это реализуется аппаратом растрово-векторных и векторно-растровых преобразований.