Эффективный поиск в Интернете

Представьте себе огромный гулкий зал библиотеки с бесчисленными рядами книг. Время от времени туда заходят люди и добавляют новые книги. Расположение томов не подчиняется никаким правилам; нет ни картотеки, ни стандартного книжного классификатора. Однако есть некоторое число независимых библиотекарей, занятых изучением и индексацией книг. Индексная система каждого библиотекаря отличается от остальных, и каждая из них описывает лишь часть фондов библиотеки. Кошмарный сон? Нет, просто современное состояние Интернета. По оценке, опубликованной в журнале Nature в 1999 году, число публично индексируемых Web-страниц составляло 800 млн. Спустя год их число увеличилось почти вдвое — до 1,5 млрд. Даже лучшие поисковые механизмы индексируют не более чем одну страницу из шести. Для того чтобы извлечь полезную информацию из Интернета, нужно знать, где и как вести поиск.

Основы поиска

Существуют десятки крупных и тысячи малых и специализированных Web-узлов, предназначенных для поиска в Интернете. В поисковых узлах используются собственные индексы Интернета, постоянно обновляемые особыми программами, называемыми «пауками». Программа-паук обследует Web, проверяя каждую ссылку на данной странице, затем на страницах, адресуемых ссылками, и сообщает своему владельцу сведения обо всех страницах для последующей индексации.

В Интернете индекс любого поискового узла может устареть за несколько недель или месяцев. Не удивляйтесь, если щелчок на многообещающей ссылке не приносит ничего, кроме сообщения об ошибке.

Приступая к поиску, вы вводите одно или несколько ключевых слов, выбираете вид поиска и нажимаете на клавишу Enter или щелкаете на кнопке. В зависимости от выбранного режима результаты поиска могут сильно различаться:

• Любое из слов. В результате поиска составляется список всех индексированных страниц, содержащих любые ключевые слова. Нередко число совпадений при таком поиске огромно. Поиск по любому слову может быть удобен в случаях, когда пользователь не уверен в ключевых словах.

• Все слова. В этом режиме поиска формируется список всех индексированных страниц, содержащих все ключевые слова, в любом порядке. При этом сохраняется вероятность получения результатов, не соответствующих теме.

• Точно по фразе. В этом режиме поиска составляется список всех индексированных страниц, содержащих фразу, точно совпадающую с ключевой; знаки препинания игнорируются.

В список не попадают узлы, посвященные одной теме, описываемой с использованием разных фраз.

Сложные поисковые функции

На главных страницах поисковых систем имеются и дополнительные функции поиска. Вот наиболее распространенные из них: • Логический поиск. Для логического поиска нужно составить критерий с использованием операторов AND, OR и NOT, при необходимости группируя ключевые слова с помощью скобок. Однако людям, не имеющим навыков программирования, бывает трудно составить правильные логические выражения.

• Категории. На многих узлах индексированные страницы упорядоченно хранятся в многоуровневом каталоге категорий. Вы можете просто просмотреть каталог категорий в поисках нужных вам материалов или дойти до определенного уровня и затем провести поиск в рамках выбранной категории.

• Исключение слов. Если перед ключевым словом поставлен знак “минус” или оно помещено в список исключений, то поисковый механизм пропускает страницы, содержащие эти слова. Благодаря этой функции, можно исключить ложные результаты при поиске по фразам, имеющим неоднозначные значения.

• Включение слов. Если перед ключевым словом поставлен знак «плюс» или оно внесено в список include, то поисковый механизм будет отыскивать лишь страницы, содержащие данное слово. Данный вид поиска позволяет уточнить результаты поиска по любым словам.

• Число результатов. На многих узлах можно указывать число элементов, отображаемых на каждой странице результатов.

• Индивидуализация. На некоторых поисковых узлах имеется индивидуализированная стартовая страница, с которой можно получить мгновенный доступ к указанной информации.

• Фразы в кавычках. Если в поисковом механизме есть функции для работы с кавычками, то ими выделяются фразы в наборе ключевых слов. При поиске по любому из слов будут обнаружены страницы, содержащие любую закавыченную фразу; при поиске по всем словам будут найдены страницы, содержащие все фразы, заключенные в кавычки.

• Поисковая форма. На некоторых узлах имеются факультативные поисковые формы, позволяющие произвести тонкую настройку многих параметров поиска. Например, указать язык, ограничиться узлами в определенном домене, провести поиск только по заголовкам или просмотреть лишь узлы, информация на которых была обновлена в течение определенного периода времени.

• Поиск среди обнаруженных страниц. Если найдено слишком много страниц, то всегда можно добавить к списку еще одно ключевое слово и повторить поиск.