Поисковые системы

Для быстрого поиска информации в Интернете разработаны специальные программы, которые по заданным адресам и ссылкам мгновенно отыскивают нужную информацию. При этом число обработанных информационных ресурсов может достигать сотен тысяч. Поисковая система – веб-инструмент, предоставляющий возможность поиска и получения информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать данные на FTP-серверах, товары в интернет-магазинах и необходимые сведения в группах новостей Usenet.

В последнее время появился новый тип поисковых "движков", основанных на технологии RSS, – семейство XML-форматов, предназначенных для описания лент новостей, анонсов статей, изменений в блогах и т.п. Можно назвать и аналогичные технологии: Rich Site Summary (стандарт RSS 0.9х) – обогащенная сводка сайта; RDF Site Summary (RSS 0.9 и 1.0) – сводка сайта с применением инфраструктуры описания ресурсов; Really Simple Syndication (RSS 2.x) – очень простое получение информации. Информация из различных источников, представленная в формате XML на базе RSS-стандартов, может быть собрана, обработана и представлена пользователю в удобном для него виде специальными агрегирующими программами.

Комплекс программ, обеспечивающий функциональность поисковой системы, называют поисковым движком или поисковой машиной.

Основными критериями качества работы поисковой машины являются релевантность, полнота базы и учет морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. Улучшение работы поисковых систем – это одна из приоритетных задач сегодняшнего Интернета.

В последние годы совокупности поисковых и сервисных программ образуют мощные общедоступные и коммерческие поисковые службы: в зарубежном сегменте Интернета – это AltaVista, Excite, Google, HotBot, Infoseek (Go) Light, Lycos, Magellan, Norbern, Yahoo!, Open Text, Web Crawler. В русскоязычном сегменте основными полнотекстовыми поисковыми системами считаются Yandex, Апорт, "Иван Сусанин", "Кирилл и Мефодий", "Россия-Он- Лайн", Rambler, List.ru, Russia on the Net, FTP-Search.

Большинство русскоязычных поисковых систем индексируют и ищут тексты на многих языках – украинском, белорусском, английском и др. Отличаются же они от "все- язычных" систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в русскоязычных доменных зонах.

Наряду с универсальными поисковыми системами большой популярностью пользуются специализированные, такие как метапоисковые MetaCrawler.com и Nigma.ru, или осуществляющие "вертикальный" поиск (по конкретным типам информации: новости, картинки, видео, фото, вакансии, группы товаров и т.п.).

Геоинформационные системы

В последней четверти XX в. появилась насущная необходимость представлять важную для бизнеса географическую и сопутствующую информацию в удобном графическом виде, совмещая на экране монитора несколько листов отсканированного изображения многослойной карты.

Бурное развитие специализированных систем и технологий, получивших название глобальных географических информационных систем – ГИС (Global Geographical Information Systems – GGIS, позже стали называть просто GIS), позволило к концу XX в. успешно решать указанную задачу (рис. 11.14).

Рис. 11.14. Предметная область работы ГИС

Современные ГИС сочетают высокую точность и качество изображения двумерных и трехмерных (рельефных) географических, геодезических, геологических, метеорологических и прочих карт и огромную справочную информацию в электронном виде (БД). Они имеют мощные инструменты для работы в глобальных и региональных сетях, инструменты обработки, анализа и визуализации динамичных данных.

ГИС-технологий – это прежде всего компьютерные технологии и системы, позволяющие эффективно работать с динамическими данными о пространственно-распределенных объектах, дополняя их наглядностью представления и возможностью строить модели и решать задачи пространственно- временного анализа. ГИС, как и любая информационная система, снабженная средствами сбора и обработки данных, дает возможность накапливать и анализировать подобную информацию, оперативно находить и обрабатывать нужные географические сведения и отображать их в удобном для пользователя виде (рис. 11.15).

Применение ГИС-технологий позволяет резко увеличить оперативность и качество работы с пространственно-распределенной информацией по сравнению с традиционными "бумажными" картографическими методами [ cnit.pgu.serpukhov.su/koi/kyk.htm].

Географические пространственно-распределенные данные позволяют идентифицировать географическое местоположение и свойства естественных или искусственно созданных объектов, а также их границ на земной и водной поверхностях, включая данные над сушей и водой и под ними, а также данные об объектах космического пространства. Эта информация может быть получена с помощью дистанционного зондирования, картографирования и различных видов съемок, включая съемки из космоса. Данные содержат четыре интегрированных компонента: местоположение и пространственные характеристики объектов; время, в течение которого зарегистрированы характеристики компонентов, и скорость изменения указанных параметров.

Области применения ГИС сегодня крайне разнообразны – землеустройство, контроль ресурсов, экология, муниципальное управление, транспорт, экономика, социальные задачи и многое другое. Первые работы по ГИС-технологиям начали проводиться свыше 25 лет назад в Канаде и США,

Рис. 11.15. Общая структура ГИС-платформы

где первоначально использовались главным образом для целей землеустройства южных и западных регионов США и картографирования канадских районов Арктики с помощью компьютерной обработки спутниковых фотографий. Сейчас большую популярность приобрели ГИС массового пользования – для генеральных электронных планов городов, планов разработки месторождений полезных ископаемых и морской разведки нефтяных пластов, схем инженерных коммуникаций, схем движения транспорта и т.п. По некоторым оценкам, до 80–90% всей информации, с которой обычно имеют дело, может быть представлена в виде ГИС различного назначения.

Сегодня все шире разрабатываются и применяются специализированные веб-ресурсы для реализации распределенных ГИС и ГИС-порталов. Разработка таких порталов производится сегодня на базе международных стандартов, разработанных известными международными организациями но стандартизации – ISO (International Organization for Standardization) и OGC (Open Geospatial Consortium). Это такие стандарты, как ISO 19115 MetaData, ISO 19139 MetaData – XML Schema Implementation, Catalog Interfaces, Geography Markup Language и Web Map Service.

В наше время на рынке ГИС-продуктов можно выделить Intergraph [intergraph.com/gis], ESRI [esri.com], Maplnfo [mapinfo.com], Autodesk [autodesk.com], CalComp, Space Imaging [geoeye.com], Центр Геоинформационных исследований Института географии РАН [mirkart.ru] и многие другие. Для непрофессиональных пользователей существуют превосходные веб-ресурсы GoogleMap [maps.google.com] и Geography NetWork [geographynetwork.com].