Формулювання запиту та одержання результатів

Засоби пошуку інформації в Інтернеті. Принципи функціонування веб-каталогів та пошукових систем. Стратегії пошуку інформації.

Поширення набули два різновиди засобів пошуку інформації в Інтернеті — веб-каталоги та пошукові системи.

Веб-каталог - сайт, на якому зібрано багато посилань на інші сайти, відсортованих і розділених на категорії згідно з тематикою.

Пошукова система - веб-сайт, призначений для пошуку сторінок, що містять задане слово або словосполучення чи відповідність іншим критеріям.

Головна перевага веб-каталогу полягає в тому, що добір посилань та їх сортування виковуються на підставі певних показників, наприклад якості вмісту сайту чи інтересу, який він може становити для користувачів. Оскільки добирають і впорядковують посилання люди, то зазвичай такий добір доволі якісний.

Список тем у каталозі, за якими відсортовано посилання на сайти, може бути величезним. При цьому теми ієрархічно впорядковані, що дає користувачу змогу переходити від загального до часткового. У кожному веб-каталозі використано свою систему класифікації, проте загальні принципи їх організації приблизно однакові. Абсолютна більшість каталогів також мають власну систему пошуку. Зазвичай пошук здійснюється за короткими описами сайтів і назвами категорій, а не за вмістом веб-сторінок, як у пошукових службах.

Веб-каталоги можна використовувати для пошуку відомостей на будь-яку загальну тему.

Найбільшим веб-каталогом у Всесвітній павутині вважають Open Directory Project у ньому містяться посилання більш ніж на 4 мільйони сайтів.

Великими є також глобальні каталоги: Yahoo! Directory, MavicaNET, російські каталоги Яндекс, Апорт, українські Мета і UaPortal.

Оскільки каталоги призначені переважно для пошуку сайтів за загальною тематикою, за їх допомогою майже неможливо знайти відповідь на якесь конкретне запитання. Це можна зробити лише з використанням пошукових систем.

Пошукові системи

Як уже було сказано, пошукова система призначена для пошуку сторінок за заданим словом, словосполученням або іншим критерієм. Кожна пошукова система складається з чотирьох компонентів.

1. Роботи. Це програми, які пошукова служба використовує для сканування (перегляду) сайтів Інтернету, збирання інформації та її передавання індексувальним програмам.

2. Індексувальна програма та база даних. Коли робот виявляє нову чи оновлену сторінку, він передає інформацію про неї індексувальній програмі, що сканує документ і заносить значущі слова до бази даних.

3. Пошукова машина. Ця програма знаходить у базі даних інформацію про сторінки, які відповідають уведеному користувачем критерію, та сортує знайдені записи так, щоб найважливіші з них відображувалися на початку списку результатів пошуку.

4. Веб-інтерфейс. Його використовують для введення критерію пошуку, а також для відображення результатів.

Формулювання запиту та одержання результатів

Запит до пошукової системи має складатися зі слів, які найточніше характеризують мету пошуку. Найчастіше використовують три слова, проте їх може бути як менше, так і більше.

Якщо запит складний, доцільно скористатися сторінкою розширеного пошуку, де за допомогою полів і розкривних списків можна сформувати складний критерій. Кожна пошукова система має власний набір параметрів пошуку, однак передбачено й стандартні можливості: введення шуканого тексту з використанням логічних операцій І, АБО та НЕ, задавання мови, вибір частини сторінки, на якій шуканий текст має міститися, зазначення часу оновлення сторінки тощо.

Пошукова система виводить одержані результати на спеціальній сторінці результатів. Кожен запис на ній містить заголовок у вигляді гіперпосилання на сторінку, що відповідає введеному критерію пошуку, фрагмент тексту із заданими словами та додаткову інформацію. Зазвичай система видає велику кількість результатів пошуку, тому в нижній частині сторінки результатів є посилання на сторінки-продовження.