Основні етапи процесу пошуку інформації

Лабораторна робота №24

Тема: Пошук інформаційних ресурсів в глобальній мережі.

Мета роботи: Набути практичних навичок роботи з пошуковими системами Internet для вирішення задач.

Звіт: Створити новий файл з назвою Пошук.doc, в якому оформити звіт до лабораторної роботи. Необхідно вказати тему, мету роботи, описати алгоритми пошуку інформації у Internet, написати адреси пошукових систем та каталогів, які були відвідані, визначити адреси сайтів із знайденою інформацією, описати Internet-магазин, зробити висновки по проведеній роботі.

Теоретичні відомості

Повнота, достовірність та швидкість пошуку.Для того, щоб знайдена інформація дійсно відображала реальний стан справ, пошук має задовольняти наступні критерії:

· повнота охоплення ресурсів;

· вірогідність інформації;

· висока швидкість проведення пошуку.

Контроль повноти охоплення ресурсів – досить серйозна проблема, в тому випадку, якщо необхідно не просто знайти будь–яку інформацію про бажаний предмет, а необхідно мати повне уявлення про предмет пошуку і стан справ з даного питання. В цьому випадку краще не обмежуватися використанням тільки однієї пошукової машини або переглядом одного каталогу. Для того, щоб провести повномасштабний збір інформації, необхідно працювати з декількома каталогами, пошуковими машинами, базами даних, регіональними телеконференціями, електронними дошками оголошень і листами розсилань. Тільки в цьому випадку можна бути впевненим, що знайдено якщо не всю, то хоча б велику частину існуючої інформації.

Контроль достовірності інформації. Internet містить достатню кількість застарілої або не достовірної інформації. В багатьох випадках це пояснюється можливістю анонімного розміщення матеріалів, особливо на безкоштовних сайтах. В основному, контроль достовірності інформації – це аналітична робота. При цьому важливо зробити перевірку знайденого фактичного матеріалу, з'ясувати статус документів, одержати інформацію про компетентність автора матеріалу і т.д.

Не варто довіряти фірмі, на сайті якої немає інших координат зв'язку, крім адреси електронної пошти, але яка пропонує товар по передплаті. Або сайту, що не входить в першу сотню найпопулярніших сайтів, але автори якого стверджують, що він має величезний успіх і намагаються продати рекламне місце за високими розцінками.

Швидкість здійснення пошуку в мережі, якщо не брати до уваги технічні характеристики підключення користувача, залежить в основному від двох факторів:

· вірного планування пошукової процедури;

· досвіду роботи з ресурсом обраного типу.

Особливе значення швидкість проведення пошуку має в тому випадку, коли потрібно знайти інформацію, що часто оновлюється. Наприклад, Ви працюєте з продуктом, ціна на який міняється кілька разів в день.

Результати пошуку. Одержавши потрібну інформацію з мережі, необхідно її перевірити.

Якщо це ціни на товари або послуги– потрібно зв'язатися з продавцем і уточнити їх (перевірити наявність необхідної продукції на складі в достатній кількості). Так само перевіряється будь–яка адресна інформація.

Аналітичну інформацію перевіряють, порівнюючи дані, отримані з декількох джерел. Таким же способом перевіряють різноманітні статистичні дані.

Якщо передбачається використання отриманої інформації для публічного огляду, необхідно записати джерело (адреса в мережі), ім'я автора (або назву організації) і дату публікації зведень, що використовувалися. Звертається увага на можливу наявність особливих вказівок щодо дотримання авторських прав.

Необхідно брати до уваги той факт, що якщо ви маєте можливість одержати інформацію, то в такий же спосіб її можуть одержати конкуренти. Що буде означати для бізнесу такий факт?

Основні етапи процесу пошуку інформації

Етап Зміст роботи этапу
Визначення предмета пошуку Визначаємо, що конкретно нас цікавить.
Складання списку ключових слів Виявляємо, як може називатися те, що нас цікавить.
Вибір інформаційного простору Визначаємо, де може знаходитися те, що нас цікавить.
Визначення інструменту для пошуку Приймаємо рішення про те, як простіше і швидше знайти те, що нас цікавить.
Попередній пошук Пробуємо знайти.
Аналіз отриманої інформації Дивимося на отримані результати. Якщо це необхідно (в тому випадку, коли отримані результати нас не влаштовують), проводимо коректування всіх попередніх дій.
Додатковий пошук Шукаємо далі, поки не одержуємо відповідь на своє питання.

Бажано визначити час, протягом якого інформація повинна бути знайдена, оцінити альтернативні способи одержання та ступінь важливості цієї інформації.

Основні методи пошуку в мережі і їх використання.Існує два основних методи пошуку інформації в Internet – з використанням пошукової машини (системи) або з використанням каталогу. При цьому сам механізм пошуку в обох випадках практично однаковий. Розходження виникають на етапі складання списку ключових слів. Для пошукової машини – це складання списку ключових слів, а для каталогу на цьому етапі визначається тематика розділів, в яких може знаходитися необхідна користувачу інформація. Приклади пошукових систем та каталогів представлені в додатках 2, 3 відповідно.

Багато пошукових систем дозволяють шукати інформацію не тільки на Web–сторінках, але й в групах новин і сховищах файлів. Таким чином, в результаті пошуку можна знайти повідомлення в групі новин або якомусь файлі. Часто замість терміну сторінка застосовується більш загальний термін – документ. Під документом мається на увазі Web–сторінка, повідомлення або файл, що містить ту або іншу інформацію. Процес пошуку досить простий: задаючи ключові слова, характерні для шуканої інформації, знаходяться потрібні документи.

Підбір ключових слів. Ефективний пошук інформації, багато в чому залежить від правильного підбору ключових слів. На основі попередньо отриманої інформації про предмет пошуку складається максимально широкий набір ключових слів у вигляді окремих термінів, словосполучень, професійної лексики, назв і прізвищ, тісно зв'язаних із проблемою.

Загальні правила формулювання запиту для пошукової машини:

· не задавайте тільки одне слово. Використовуйте цілі фрази, або, принаймні, кілька слів;

· вказуйте слова, що не повинні зустрічатися в шуканих документах. Звичайно для цього використовують або знак "–", або ключове слово NOT;

· починайте власні імена, назви компаній, міст, прізвища людей та ін. з великих букв, а всі інші слова пишіть тільки маленькими буквами;

· якщо ви хочете знайти словосполучення цілком – записуйте його в лапках;

· якщо ви вводите запит до пошукової машини, що складається з декількох слів, то в результаті одержуєте список документів, в яких зустрічається хоча б одне слово із запиту.

Пошукова машина здійснює сортування документів за принципом релевантності. При індексації документів пошукові машини вираховують так званий "об’єм" слова на сторінці – співвідношення кількості повторів на сторінці заданого слова до загальної кількості слів на сторінці документа. Якщо задається запит, що складається з декількох слів, то більш релевантними будуть документи, в яких сукупна вага слів буде максимальною. Однак, при підрахунку об’єм не враховується, чи поруч, чи роздільно знаходяться дані слова, і тому немає гарантій, що в перших документах міститься максимальна кількість повторень словосполучень. Цілком можливо, що такого словосполучення там взагалі не буде.

Тому, якщо необхідно знайти задане словосполучення, то запит у вікні пошукової машини записується в лапках. В цьому випадку буде вираховуватися об’єм словосполучення цілком. Відповідно, гарантується наявність саме даного словосполучення в знайдених документах.

Критерієм правильності вибору ключових слів буде кількість документів, знайдених пошуковою машиною при попередньому пошуку. Якщо вони обчислюються сотнями – то необхідно уточнити запит, ввівши додаткові ключові слова або скориставшись спеціальними засобами розширеного пошуку. Якщо не знайдено жодного документа – складається список синонімів даного терміна або перевіряється орфографія.

Вибір пошукових інструментів. Цей етап визначає всю подальшу технологію пошуку. Переходити до нього слід тільки після аналізу попередньо отриманої інформації.

Пошукові машини.За допомогою пошукових машин легше знайти щось конкретне і змістовне, а за допомогою каталогів – щось загальне і невизначене. Для пошукової машини – головне релевантність виданих посилань, а на цей показник, крім розміру, впливає структура бази даних і синтаксис мови запитів.

Каталоги. За допомогою каталогів зручно шукати інформацію на загальні теми (природа, мистецтво, комп'ютери, медицина і т.д.). Каталог має рубрикатор. Таким чином, інформація деякою мірою відсортована. При вирішенні досить стандартної пошукової задачі саме каталог, а не пошукова машина виявляються більш прийнятними для початку пошуку.

Багато в чому тип інформаційного ресурсу, що вимагається, визначається характером шуканої інформації:

· адресна інформація – адресні довідники;

· новини – новинні портали й інформаційні агентства, списки розсилань;

· конкретна інформація – пошукові машини;

· загальні зведення – каталоги;

· статистика – сервера статистичних служб, рейтинги;

· необхідно щось купити – Internet–магазини і дошки оголошень;

· необхідно проконсультуватися – сайти компаній, що спеціалізуються на даній тематиці і списки розсилань.

· файлидоцільно шукати за допомогою FTP–шукача, MP3 (файли музичних здобутків, записані й оброблені в цифровому форматі) – за допомогою MP3–розвідувача. В запиті вказується найбільш ймовірне ім'я файлу, наприклад, «name.jpg»;

· дуже рідкісна інформація – необхідно знайти ресурси, присвячені більш загальній темі. Можливо там будуть розміщені посилання на необхідні ресурси або будуть опубліковані необхідні матеріали;