Поисковые машины или поисковые указатели

Поисковые машины устроены несколько иначе. По сути – это сервер с огромной базой данных URL-адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индексирует страницы). Более того, этот сервер обращается по всем встречаемым на страницах ссылкам, поэтому при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты Интернет. Для сбора сведений о ресурсах поисковая машина использует специальные программы, которых называют червяками, пауками, спайдерами, краулерами и т.п.

Некоторые зарубежные поисковые машины:

Fast Search (www.alltheweb.com) – одна из мощнейших поисковых машин на сегодняшний день. Скорость поиска системы составляет доли секунды и нет рекламы. Малоизвестна, т.к. была открыта сравнительно недавно, в 1999 г.

Alta Vista (www.altavista.com),

Google(www.google.com) – возможен поиск на русском языке,

Northern Light(www.northernlight.com.)

Российские поисковые машины:

Рамблер(www.rambler.ru),

Апорт2000 (www.aport.ru),

Яндекс(www.yandex.ru),

Lupa.ru (www.lupa.ru).

Классификационно-рейтинговые системы.

Классификатор похож на каталог, но в отличие от каталога перед ним не ставится задача собрать как можно больше информации о ресурсах сети. По каждой из категорий, входящих в классификатор, представляются лучшие сайты, а дальше работает счетчик. Выбрав интересующую тему, пользователь получает список Web-узлов, посвященных данной теме, и рейтинг их популярности, которая измеряется в количестве посещений за последние сутки. Рейтинг – это сортировка ссылок в порядке их посещаемости.

Есть некоторые Web-узлы, специализирующиеся на ведении рейтингов:

«Рамблер Тор 100» (www.rambler.ru) -самый крупный классификатор в России,

http://dir.spylog.ru

Приемы поиска информации.

Несмотря на то, что интерфейс всех поисковых систем различен, все они имеют два общих элемента – это строка ввода запроса пользователя, и кнопка Поиск. Если на основной странице поисковой системы есть тематический каталог, то нужно определиться с тематикой поиска, это значительно ограничит пространство поиска и ускорит работу поисковой системы.

Поиск по одному ключевому слову прост, но приводит к формированию огромного списка страниц, полезную информацию здесь найти трудно.

Гораздо эффективнее поиск по нескольким словам, но здесь важную роль играет связь между словами, которая помогает системе обрабатывать эту группу слов. Для эффективного поиска по нескольким ключевым словам нам нужны специальные команды, которые позволяют связать отдельные слова между собой. Эти команды в поисковых системах образуют язык запросов. В нем всего несколько команд, и освоить его по инструкции, имеющейся на сервере поисковой системы довольно просто. Каждая поисковая машина использует свой язык запросов, поэтому при использовании разных поисковых систем надо знать особенности каждой. Но есть общий принцип, согласно которому все команды можно разделить на три группы:

- команды простого поиска,

- команды расширенного поиска,

- команды специального поиска.

Рассмотрим приемы формирования запросов на примере поисковой машины Апорт2000 (www.aport.ru).

Средства простого поиска.

1. Поиск группы слов. Большинство российских поисковых систем, как и поисковая машина Апорт, воспринимает группу слов так, как будто между ними стоит союз И. Например, лица в розыске.

2. Поиск словоформ. В большинстве случаев Апорт позволяет находить разные словоформы, например, запрос допрос несовершеннолетнего можно было сформулировать несовершеннолетний допрос.

3. Поиск точных форм. Иногда нужно от словоформ отказаться. Допустим нас интересует слово престол, а не престольный и не первопрестольный. В этом случае Апорт использует восклицательный знак, например: !престол.

4. Роль заглавных букв. Для большинства поисковых систем заглавные буквы воспринимаются буквально. Так, например поиск по словам укажет только на те страницы, где встречаются слова Красная Шапочка. А поиск по запросу красная шапочка укажет на страницы, где встречаются слова Красная Шапочка, и Красная шапочка, и красная Шапочка, и красная шапочка.

5. Значение подстановочных символов. Апорт позволяет использовать символ * вместо любого количества символов до конца слова. Например, если нужны документы, в которые входят слова Татарская республика и , то можно использовать только: республика Татарс*.

6. Учет зарегистрированных слов. Зарегистрированными словами (стоп-словами) считаются те, которые не учитываются при поиске. Обычно к ним относятся все слова, которые меньше 4 символов – предлоги, союзы, местоимения, артикли и т.д. Так, например в запросе все о юристах будет учитываться только слово юристах и его словоформы. В специализированных поисковых системах к зарегистрированным могут относиться слова, характерные для этих систем. Например, если поисковая система ориентирована на поиск книг, то вероятнее всего слово книга в ней при обработке запроса не будет учитываться.

7. Средства контекстного поиска. Взятая в кавычки фраза ищется буквально, то есть так как она написана, без словоформ. Это очень полезный вид поиска.