Пошук інформації в Internet

У мережі Internet пошук забезпечують спеціальні пошукові служби. Усі пошукові системи WWW засновані на гіперпосиланнях. Звертаючись до пошукової служби, формулюється запит, у якому формально описується те, що потрібно знайти. Провівши потрібні операції, пошукова служба формує Web – документ, що складається з гіперпосилань на Web-ресурси, які відповідають запиту.

Кожна пошукова система має власні методи пошуку та особливості в правилах запису комбінації ключових слів. Однак є загальні елементи, які однаково справедливі для більшості пошукових систем. Насамперед, треба помітити, що чим точніше сформульовано завдання, тим точніше будуть і результати.

Існує дуже багато пошукових систем. найпотужніша з них - система компанії Google, адреса www.google.com. Існують також такі системи як російський Rambler (www.rambler.ru), Яndex (www.jandex.ru), українська Мета (www.meta.ua) та багато інших.

Існує два основних методи пошуку інформації: за допомогою ключових слів та пошук по категоріях. Розглянемо пошук за допомогою ключових слів, які відображають сутність того, що ми шукаємо. Знайдемо наприклад якісь дані про озиму пшеницю. Для цього завантажимо любу WEB-сторінку пошукової системи, наприклад Rambler (www.rambler.ru) та у полі для ключових слів введемо із клавіатури наступні слова: озима пшениця. Ці слова означають, що пошукова система буде шукати всі документи, де зустрічається таке словосполучення або сукупність цих двох слів (рис. 4.9).

Рисунок 4.9 Результати пошуку по запиту озима пшениця за допомогою пошукової системи www.rambler.ru

Отримуємо результат із 12586 знайдених документів, гіперпосилання на які доступні у результатах пошуку.

Наприклад, для того, щоб пошукова системи знайшла сторінки, на яких одночасно були присутні усі використані ключові слова, то перед кожним з них треба поставити знак “+”. +Озима + пшениця

Рисунок 4.10 Результати пошуку по запиту озима пшениця за допомогою пошукової системи www.rambler.ru

Пошукова система видасть список сторінок, на яких зустрічаються ключові слова, хоча, звичайно, не виключено, що між ними немає прямого зв'язку. Список слів може бути більшим – тоді результати пошуку будуть точнішими. Використовуючи знак “+” коло пошуку звужується і зменшується кількість можливих посилань.

Знак “+” розуміють всі основні пошукові системи. А наступні системи виконують такий пошук автоматично, навіть якщо знак “+” не зазначений: Aport 2000, Google, Lycos, MSN Search, Rambler.

Звужувати коло пошуку можна не тільки знаком “+”, але і знаком “-“. Команда “+” розшукає всі сторінки, де присутні ключові слова, а команда “-” виключить сторінки, де зустрічаються слова, перед якими стоїть цей знак. Наприклад словосполучення „озима+пшениця-ячмінь”означає знайти всі сторінки де зустрічається словосполучення „озима пшениця” і немає слова „ячмінь”.

Найбільш розповсюдженими для більшості пошукових систем є команди, так званого пошуку по масці, які позначаються символами “зірочка” – “*” та “знак питання” – “?”. Знаком “?” в ключовому слові запиту замінюють одну букву, на місце якої може бути підставлена будь-яка, а знаком “*” – послідовність символів (рис. 4.11).

Рисунок 4.11 Результати пошуку по масці за допомогою пошукової системи Google.

 

У випадку використання лапок пошукова система розшукує документи, у яких абсолютно точно є той текст, що у них вкладений. Пошук за допомогою лапок називається контекстним пошуком (рис. 4.12).

Рисунок 4.12 Результати контекстного пошуку за допомогою пошукової системи Google.

Важливим також є пошук гіперпосилань на потрібні сторінки. Пошук посилань буває корисним власникам Web – сторінок і Web – майстрам. Він дозволяє кількісно оцінити динаміку популярності своєї сторінки регулярним контролем числа посилань, що до неї ведуть. Типова команда для такого пошуку – link.

Команду link: підтримують наступні пошукові служби: AltaVista, Infoseek, Google (рис. 4.13).

Рисунок 4.13 Результати пошуку посилань за допомогою пошукової системи www.google.com.ua

Засоби розширеного пошуку

У більшості пошукових систем команди розширеного пошуку формуються за допомогою логічних команд і розраховані на професіоналів. Зручність використання логічних команд зокрема пов'язано з тим, що команди простого пошуку в багатьох пошукових систем реалізовані по-різному. Кожна система прагне зробити засоби простого пошуку найбільш зручними, а засоби розширеного пошуку – найбільш стандартними.

При розширеному пошуку використовуються наступні оператори:

1. &, AND логічне перетинання ( І )

2. ~, NOT логічне виключення (І НЕ)

3. "ô" OR – логічне об'єднання (АБО)

4. <- - оператор уточнення запиту (перший аргумент уточнюється другим).

Команда OR.

Логічна команда OR (або) служить для формування пошукового завдання з декількох ключових слів. Якщо треба, щоб розшукуваний документ містив будь-які з цих слів у будь-якій комбінації.

По запиту 'собака OR кішка' будуть знайдені всі документи (рис. 4.14), в яких є хоча б одне із слів 'собака' чи 'кішка' (або ці слова разом).

Рисунок 4.14 Засоби розширеного пошуку пошукової системи Яndex

Команда AND.

Логічна команда AND (і) служить для формування пошукового завдання, коли треба, щоб розшукуваний документ містив одночасно всі слова, уведені користувачем. Це аналогічно команді “+” простого пошуку. Наприклад, по команді світло AND промінь будуть розшукані всі Web – сторінки, що містять ці слова.

Система Rambler використовує ключове слово AND або знак “&”, а система Яndex знак “&” або пробіл, якщо потрібна одночасна присутність слів в одому реченні, або пари знаків “&&”, якщо потрібне одночасна присутність слів в усьому документі.

Рисунок 4.15 Засоби розширеного пошуку пошукової системи Яndex

Команда NOT.

Логічною командою NOT (ні) встановлюють виключення з результатів пошуку, тобто це аналогічно розглянутій вище команді простого пошуку “-“. Результати використання такої команди представленні на рисунку 4.16.

Малюнок 4.16 Засоби розширеного пошуку пошукової системи Яndex

Для пересічного користувача складні математичні оператори можуть виявитися дуже важкими у використанні. Для такого випадку кожна пошукова система маэ посилання на свою сторінку із параметрами розширеного пошуку, у полях якої можна ввести всі потрібні параметри для більш точного пошуку потрібної інформації (рис. 4.17).

Рисунок 4.17 параметри розширеного пошуку пошукової системи компанії Google.

Пошук по категоріям.

Багато сучасних пошукових систем ведуть облік існуючих Web-сторінок і групують їх по певних тематичних признаках. Користувач може ознайомитись із переліком сайтів, згрупованих по тематиці на багатьох пошукових системах (наприклад компанії Мета – www.meta.ua. Всі сторінки згруповані по направленості сторінки, наприклад бізнес, спорт, фінанси і т.д.(рис. 4.18).

Рисунок 4.18 Групи сторінок по тематиці.

Користувач може вибрати певну тему, наприклад „Новости” і перейти до списку сторінок із назвою та адресами сайтів, які спеціалізуються на новинах (рис. 4.19)

Рисунок 4.19 Список сторінок новин

Система при виборі тематики надасть також адреси, вистроїть їх по популярності та згрупує по 15 штук на одній сторінці. Кожен запис сторінки є гіперпосиланням на відповідний ресурс, клацнувши на якому лівою кнопкою мишу можна відкрити ресурс, що вас цікавить.