Основні теоретичні відомості. Нині в мережі Internet за різними оцінками розміщено 200-250 млн

Нині в мережі Internet за різними оцінками розміщено 200-250 млн. документів (Web-сторінок). Інформаційні джерела WWW-системи настільки значні за обсягом, що недосвідченому користувачеві легко „заблукати” в ній у пошуках необхідних даних. Тому так само, як для звичайних публікацій, створюються каталоги, довідники і реферативні журнали, для WWW-сторінок - спеціальні пошукові сервери, які збирають і зберігають характеристики документів у своїх базах даних. Пошукові сервери надають свої послуги користувачам Internet безкоштовно, усі їх витрати виправдовуються за рахунок спонсорів-рекламодавців.

Програмне забезпечення пошукового серверу складається з трьох частин:

Ø Програми – мережевого робота або spider (worm, crawler), який постійно переглядає Web-сторінки, які він може розшукати в Internet. При кожному звертанні до Web-сторінки він записує усі ULR – адреси, які містяться в ній, і використовує їх для пошуку нових документів в Internet. Додатково пошукові сервери приймають замовлення від користувачів про включення в базу даних відомостей про їхні Web-сторінки, і використовують цю інформацію для розширення пошуку.

Ø Програма індексування – приймає від робота інформацію про ULR–адреси та всі слова розшуканої ним Web-сторінки і записує їх у величезну базу даних у спеціальному форматі. Завдання програми індексування – зв’язати усі слова сторінки з її адресою.

Ø Пошукова програма – починає роботу, як тільки користувач звертається до пошукового серверу з запитом. Вона переглядає базу даних, шукає в ній ключові слова та включає розшукані ULR – адреси до списку результатів пошуку.

Пошукові сервери пов’язані між собою. Спеціальні програми-спайдери (павуки) постійно переглядають вузли, корегуючи власні бази даних. Оперативність їх роботи забезпечується за рахунок швидкодіючої апаратури. Так пошуковий сервер altavista.digital.com сканує до 6 млн. сторінок за добу.

Інтерфейс майже всіх пошукових машин стандартизований. У верхній частині головної сторінки розташоване поле для введення запиту будь-якого слова, рази або спеціального виразу, складеного згідно із синтаксисом мови запитів даного сервера.

Роботу з усіма пошуковими машинами здійснюють у такій послідовності:

Ø відкривають головну сторінку пошукової машини;

Ø вводять запит у поле для вводу і натискують Enter або на кнопку Найти, Поиск, Search;

Ø вибирають потрібну сторінку у знайдених пошуковою машиною сторінок.

Пошукові програми різних серверів відрізняються одна від одної. Деякі з них дозволяють для конкретизації пошуку використовувати як ключі цілі фрази, а інші включають до результатів пошук документи, що містять хоча б одне слово з декількох запитаних.

Для пошуку потрібного Web-ресурсу достатньо завантажити програму-браузер та звернутися за її допомогою до пошукового серверу, вказавши його адресу в рядку Адрес.

При зверненні до пошукового сервера за його ім’ям у вікні відкривається сторінка, що містить каталоги з різних тем (наука, спорт, погода, новини і т.ін.) й елементи для виконання контекстного пошуку.

Каталогом є список сайтів за категоріями. Складають такий список спеціалісти, які переглядають вміст сайтів і визначають, якої теми стосується певний ресурс, створюють до нього опис і розміщують посилання на нього у відповідну рубрику. Об’єм посилань, що обробляється таким способом, незначний порівняно з кількістю сайтів Internet, однак перевагою обробки вручну є точна відповідність посилання на сайт рубриці за змістом.

Завдяки каталогам можна вести спрямований пошук необхідних даних, переглядаючи зміст каталогів.

Крім цього, пошукові сервери виконують контекстний пошук, тобто пошук за вмістом документів, використовуючи власні бази даних.

На сторінці є спеціальне поле, в якому задається запит, що вказується у вигляді виразу, який містить ключові слова для пошуку або їх комбінацію з використанням логічних операторів "І" ("+"), "АБО" (","), "НІ" ("-") та ін. Отриманий від пошукового серверу результат являє собою відсортований список ULR – адрес Web-сторінок, що формально задовольняють пошуковому запиту. Крім того, у результатах пошуку наводиться текстова назва Web-сторінки, інколи стислий опис ресурсу.

Правила створення запитів до пошукових серверів. На різних серверах програми пошуку використовують різні правила контекстного пошуку: Але є й спільні тенденції при виборі ключових слів, а саме:

1. використовувати ключові слова, характерні саме для конкретної теми, тобто конкретизувати запит

2. використовувати низку службових операторів, які дозволяють уточнити запит, наприклад

a. + - логічний оператор И. Цей оператор припускається і діє першим, тобто запит українські реферати рівнозначний українські+реферати

b. -- логічний оператор НЕТ – дозволяє виключити зі списку результатів документи, які містять слово, що йде після цього оператора

c. | - логічний оператор ИЛИ – дозволяє знайти документи, які містять хочаб одне слово в запиті.

3. задавати порядок дії логічних операторів круглими дужками (), наприклад, якщо необхідно задати документи, в яких зустрічаються слова харківські підприємства або київські підприємства запит повинен бути такий (харківські|київські) підприємства

4. окрім логічних виразів можливо визначити відстань між словами запиту

a. “…” –подвійні лапки дозволяють знаходити точне словосполучення, вказане в них

b. {…}-фігурні дужки дозволяють знаходити словосполучення, близьке до вказаного в них, тобто на відміну від попереднього оператора граматична форма слів у цьому разі не фіксується.

c.[n, …] – цей оператор використовується, якщо необхідно обмежити відстань між словами, наприклад [5, мобільний телефон] – будуть знайдені тільки ті документи, в яких слова мобільний і телефон розташовані у фрагменті тексту, не більшому ніж 5 слів.

5. використовувати оператори, які дозволяють обмежити область пошуку визначеним полем документа

Title – оператор дозволяє шукати тільки за назвою документа (наприклад, Title(прайс-лист) – знайдені ті документи в назві яких є прайс-лист)

Heading – оператор дає змогу проводити пошук за назвами розділів документів (наприклад, за запитом heading(бізнес-план) будуть знайдені документи, які містять бізнес-план в полі heading документів ).

6. вести пошук у реєстрі (пошук у реєстрі ведеться з урахуванням російської, української та англійської морфології)

За замовчуванням пошук здійснюється за повнотекстовою базою даних, для пошуку у реєстрі необхідно поставити прапорець шукати в Реєстрі.

7. можливо обмежити область пошуку окремою темою або регіоном. Для цього необхідно прейти у відповідну тематичну (регіональну рубрику та поставити прапорець «шукати в розділі» або «шукати за регіоном», при цьому пошук буде проводитись за повнотекстовим індексом, якщо поставити ще «шукати в реєстрі», то пошук буде проводитись тільки за описами сайтів у визначеному розділі.

Якість пошуку і кількість знайдених документів багато в чому залежать від конкретного запиту і обсягу бази даних сервера, наприклад, вони відрізнятимуться для запитів "менеджмент" і "менеджмент+підприємство". На сторінці зазвичай є довідка зі складанням запиту, з якою доцільно познайомитися перед пошуком.

Релевантність документа – це міра того, наскільки точно той або інший документ, знайдений пошуковою системою, відповідає критеріям, зазначеним у запиті користувача. Єдиних поглядів на це поняття немає. Не завжди документ, відзначений пошуковою системою найрелевантнішим за формальними ознаками, буде таким на думку самого користувача.

З метою проведення первинного пошуку на конкретну тему доцільно використати пошукові каталоги. Для фахівців, добре знайомих із ресурсами мережі Internet у своїй галузі, кориснішим є пошук за ключовими словами.

До найпоширеніших пошукових машин у мережі Internet належать українські:

www.meta-ukraine.com..ua (Мета)

www.search.avanport.com (Пошуковий сервіс порталу Аванпорт)

www.altasua.net (AltasUA)

www.google.com.ua (Google-Україна)

www.gala.net (Gala.net)

www.bigmir.net (Bigmir)

www.uaportal.com (Uaportal)

Найпопулярнішими у російськомовній частині є такі пошукові сервери:

www.rambler.ru (Rambler)

www.yandex.ru (Яndex)

www.aport.ru (АПОРТ)

www.el.visti.net

www.list.ru

Міжнародні пошукові системи в англійськомовній частині мережі:

www.altavista.digital.com (Alta Vista)

www.yahoo.com (Yahoo!)

www.infoseek.com (Infoseek)

www.excite.com (Excite)

www.lycos.com (Lycos)

розшукують Web-сторінки на будь-якій мові.

Rambler- пошукова система на серверах Росії й інших пострадянських країн, з розвинутою мовою запитів і гнучкою формою виведення результатів. У ній здійснюється рейтинг вузлів/сторінок за їх відвідуванням користувачами Internet з урахуванням класифікації. Rambler надає можливість отримати курси валют, оперативні економічні новини, котирування акцій та іншу економічну інформацію, яка оновлюється щодня.

Яndex – інформаційно-пошукова система з урахуванням морфології російської мови. Для всіх слів цієї мови робиться аналіз, формою якого слова вони є.Пошук ведеться більш ніж по 15 тис. серверів. Основною перевагою Яndexявляється здатність знаходити задані слова незалежно від форми, в якій вони використовуються в документах. Система може утворювати словоформи навіть для тих слів, яких немає у словнику. Система підтримує логічні операції И, ИЛИ та НЕ, логічні групи, пошук по висловам, причому дія операторів И та НЕ може розповсюджуватися як на один абзац, так і на весь документ вцілому. Пошук може вестись як по усім формам ключових слів, так і по конкретно заданій формі. Можливе визначення відстані між словами з урахуванням їх порядку та ін.Адреса Яndex - http://www.yandex.ru.

Апорт – унікальна двомовна пошукова машина. Апорт містить багато сучасних ресурсів російського Internet. Істотна перевага Апорт – англійсько-російські і російсько-англійські переклади запитів і пошуків результату.

Апорт - одна з кращих російськомовних пошукових систем, що входить в число ведучих пошукових систем, сертифікованих Microsoft як локальні пошукові системи для російської версії Microsoft Internet Explorer. Адреса Апорту-http://www.aport.ru

Українська пошукова система МЕТА функціонує за технологією системи Апорт. МЕТА спадкує всю міць та ряд надзвичайних властивостей Апорт, таких як реконструкція тексту, підтримка морфології російської та англійської мов тощо.

Система має оригінальну базу даних для пошуку в українських Internet-ресурсах як на території України, так і за її межами. Офіційне відкриття серверу відбулося в листопаді 1998року. З моменту свого створення МЕТА підтримується командою харківських розробників.

Адреса української пошукової системи МЕТА -http://www.meta-ukraine.com.

Порядок виконання роботи

1. Переглянути послідовно Web-сторінки пошукових систем Rambler, META, ELVisti, Apor. Переглянути зовнішній вигляд пошукових систем Rambler, настройки, засоби пошуку і допомоги, каталоги.

2. Вивчити довідку по складанню запитів.

3. Зберегти адресу відкритої сторінки в папці під ім’ям "Російськомовні пошукові системи" (ИзбранноеÞДобавить в);

4. За допомогою каталогів провести спрямований пошук по групі товарів згідно свого варіанту (див.табл.4.1).

Таблиця 4.1

№ варіанту Найменування № варіанту Найменування
Процесори Принтери
Побутова техніка (холодильники) Побутова техніка (мікрохвильові печі)
Побутова техніка (телевізори) Побутова техніка (пилесоси)
Побутова техніка (пральні машини) Побутова техніка (обігрівачі)
Побутова техніка (праски) Побутова техніка (очисні фільтри для води)
Мобільні телефони Аудіотехніка
Легкові автомобілі Комп’ютери
Вантажівки Фотоапаратура
Сканери Монітори

5. За допомогою україномовних служб пошуку у мережі Internet (www.meta-ukraine.com, www.altasua.net, www.gala.net, www.bigmir.net, www.uaportal.com) виконати пошук документів з комерційною інформацією по групі товарів згідно з варіантом, з вказівкою назви, постачальника, числових характеристик, ціни на продукцію, дати виготовлення.

6. За допомогою гіперпосилань виконати перегляд продукції всіх постачальників (дилерів) цього виду продукції.

7. Перенести необхідну інформацію у вигляді таблиць у Word, або у електронні таблиці Excel. Оформити таблиці відповідно до обраного стилю. Зберегти таблицю на диску, який вкаже викладач під ім’ям Товар. Таблицяповинна містити не менш як 30 записів обраної продукції від 5 - 10 постачальників.

8. Упорядкувати дані таблиці за назвою постачальників та однією з числових характеристик.

9. Перегляньте матеріали в 2-3 енциклопедіях (www.dic.academic.ru), знайдіть та порівняйте визначення трьох економічних термінів (N, N+5, N+7, де N – номер студента у списку групи):

1. Акція. 2. Аннуітет. 3. Депозит. 4. Дисконт. 5. Ефективна ставка. 6. Індекс інфляції. 7. Інфляція. 8. Імовірнісна рента. 9. Конверсія. 10. Крос-курс. 11. Курс валютний. 12. Курс спот. 13. Курс форвард. 14. Маржа. 15. Негайна рента. 16. Номінальна відсоткова ставка. 17. Облігація. Емітент облігації. 18. Період нарахування відсотків. 19. Прості проценти. 20. Відсоткова ставка. 21. Погашувальний фонд. 22. Р-строкові ренти. 23. Ризик фінансових операцій. 24. Складні відсотки. 25. Темп інфляції. 26. Форвардний контракт. 27. Ф’ючерсний контракт.

У звіті по роботі повинні бути тема та мета роботи; порядок дій по кожному пункту завдання; висновок про роботу. Під час захисту роботи студентом повинні бути представлені на гнучкому диску файли Товар.doc і адреса Web-сторінок в папці Избранное.

Питання для самоконтролю

1. Що таке пошукова машина? Назвіть основні пошукові сервери, вкажіть які з них україномовні.

2. Чим відрізняється контекстний і спрямований пошук інформації?

3. Як організувати первинний пошук на конкретну тему?

4. Як організувати контекстний пошук (пошук за вмістом документа)? Які логічні оператори при цьому можна використовувати?

5. Які правила для створення запитів до пошукових серверів ви знаєте?

6. Чи відрізняються ці правила при використанні україномовних та російськомовних пошукових серверів?