Обобщенная структура и основные компоненты информационно-поисковых систем для WWW. Понятие индекса. Особенности процедуры индексирования

По пространств. масштабу ИПС:

§ локальные (для быстрого поиска стр. в масштабе отдельного сервера)

§ региональные (описыв. информационные ресурсы опред. региона)

§ глобальные (описыв. ресурсы всего информационного простр-ва сети Инт.)

§ специализированные

Поиск – в собственной базе (индексе) с описан. распределенных источников информации.

Сначала - описать информационные ресурсы и создать индекс. Построение индекса – с определения начального набора URL источника информации. Затем – индексирование.

Индексирование – описание ист. информации и построение спец. базы данных (индекса) для эффектив. поиска. Иногда описание ист. инф. проводится персоналом ИПС, кот. сост. краткую аннотацию на каждый ресурс. Затем - сортировка аннотаций по темам (составление тематич. каталога).

Процедура описания занимает значит. период времени, поэтому индекс имеет ограниченный объем. В ИПС др. типа процедура описания информации ресурсов автоматизир. Для этого - спец. программа - робот, кот. по опред. технологии обходит ресурсы, описыв. их (проводит индексир.) и анализир. ссылки с текущей стр. для расширения области поиска.

Чаще всего просто составляется список слов, кот. встречаются в тексте и др. частях док-та., при этом учитывается частота повторения и местоположения слова т.е. слову приписывается весовой коэффициент в зависимости от его значимости. Затраты времени невелики.

Классификация средств поиска. Приемы работы с тематическими каталогами.

Каталог – поисковая система с классифицируемая по темам списком аннотаций со ссылками на web-ресурсы.

Классификация проводится людьми.

Автоматический индекс (поисков. машина) – поисковая система с формируемой роботом базой данных, содержащая информацию об информационных ресурсах.

Метапоисковая. система – система, не имеющая своего индекса, способная послать запросы пользователю одновременно неск-ким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документов со ссылками.

Программа ускорен. поиска – программа с возможностями метапоисковой сис-мы, устанавливаемая на локальном компьютере.

Отличие метапоиск. сис-м и программ ускор. поиска от ИПС - отсутствие собств. индекса. База данных ссылок (индекс) каталога имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.

Результат поиска в каталоге - в виде списка, сост. из краткого описания (аннотации) док-та с гипертекст. ссылкой на первоисточник.

Поисковые машины (автоматические индексы). Простой и сложный режимы поиска. Обобщенные возможности формирования запроса с использованием операторов. Режим сложного (расширенного) поиска. Представление и обработка результатов поиска.

Поисковая машина – поисковая сис-ма с формируемой роботом базой данных, содержащая информацию об информационных ресурсах.

Простой поиск - введение через пробел одного или нескольких слов; поиск слов со всевозможными окончаниями моделируется символом * в конце слова. Словосочет. или фраза - в " ".

Основная проблема – поисковая машина найдет все страницы, на кот. встречаются указанные слова. Многие поиск. сис-мы включают в свой язык составл. запросов спец. операторы, позволяющие проводить поиск в определенных зонах док-та.

Возможность - поиск док-тов в сети, ссылающийся на стр. с указанным адресом (URL). Режим расшир., или детального запроса чаще всего это бланк, в котор. упомянутые операторы и ключевые элементы реализ. простой установкой соответствующих флажков или выбором параметров из списка.

Способы представления результатов поиска: в качестве ф-мы выдачи составляется список документов по 5-10-15 единиц на стр. с возможностями перехода к след. порции внизу стр. Обязательно указывается заголовок и URL (адрес) найденного док-та.

В описании док. чаще всего – несколько первых предлож. или выдержки из текста док-та с выделением ключ. слов, указана дата обновления док-та, его размер в кбайтах.

Если описание док. соответствует требованиям - перейти к первоисточнику по ссылке. Услуга поиска похожих документов.