Інформаційно-пошукові системи в економіці

Засобом зберігання та пошуку необхідної інформації є автомати­зовані інформаційно-пошукові системи (АІПС).

Інформаційний пошук - це сукупність операцій, необхідних для знаходження документів, текстів, відомостей, фактів та даних, які відповідають запиту користувача.

ІПС - це сукупність методів і засобів, призначених для зберіган­ня та пошуку документів, відомостей при них чи певних фактів. ІПС можна класифікувати за різними ознаками:

1. За тематикою інформаційних масивів - галузеві та вузькотематичні.

2. За типом інформації, що зберігається в системі - документа льні та фактографічні (об'єктом зберігання й пошуку є окремі дані, що хара­ктеризують деякі події, процеси, явища, тобто факти).

3. За режимом функціонування - системи, які працюють у режимі з вибірковим пошуком інформації, і системи з ретроспективним її пошуком.

Системи з вибірковим пошуком — це такі, в яких пошук викону­ється за постійним набором запитів для певного контингенту корис­тувачів.При цьому змінюється зміст масивів ІПС, а за­пити лишаються без змін.

У системах з ретроспективним пошуком у всіх масивах, що збе­рігаються в системі, пошук виконується за разовими запитами, які можуть змінюватись залежно від інформаційних потреб користувача.

Автоматизована інформаційна пошукова система виконує такі основні операції:

введення у систему пошукових образів документів чи по­шукових образів разом із самими документами; зберігання інформації в системі;

формування запитів, опис пошукових розпоряджень та вве­дення їх у систему;

пошук, тобто порівняння пошукових образів документів з пошуковими розпорядженнями, прийняття рішення про видачу від­повідної інформації;

видача інформації, що відповідає інформаційному запиту.

Найефективніший засіб пошуку інформації - це перегляд кожно­го документа і перевірка на відповідність його інформаційному запи­ту. Проте для зберігання інформації в повному обсязі необхідно ба­гато пам'яті, а сам інформаційний пошук триватиме досить довго.

Тому в АІПС виконується пошук не за текстами самих докумен­тів, а за їх короткими характеристиками, які називаються пошукови­ми образами.

Пошуковий образ - це виражений у термінах інформаційно-пошукової мови основний зміст документа, який підлягає зберіганню в АІПС.

Процедура визначення пошукового образу називається індексу­ванням і полягає в семантичному аналізі основного змісту документа та перекладі його інформаційно-пошуковою мовою. Отже, в АІПС зберігаються не тексти документів, а їх пошукові образи. Для пошу­ку документів запити, як і самі документи, підлягають індексації, тобто перекладу ШМ.

Інформаційний запит, перекладений ІПМ і доповнений допоміж­ною інформацією для пошуку (рік видання, серія і т. ін.) називається пошуковим розпорядженням (ПР). Прийняття рішення про успішне завершення пошуку може бути прийняте не обов'язково при повному (стовідсотковому) збігу пошукового образу і пошукового розпоря­дження. Для прийняття рішення про успішне завершення пошуку збіг ПР і ПОБ може бути на 70 і навіть на 50 %. Це залежить від кри­терію пошуку, який може змінюватися за бажанням користувача. Тобто результатом пошуку текстової інформації може бути не один якийсь документ, а ціла їх підмножина, із якої користувач може віді­брати ті документи, що найбільш відповідають його інформаційній потребі.

Інформаційно-пошукова мова - це спеціалізована штучна мова, яка призначена для опису центральних тем чи предметів і формаль­них характеристик документів, а також для опису інформаційних за­питів і наступного виконання пошуку.

Природні мови не можуть бути використані як ІПМ через недо­статню структуризацію, велику кількість граматичних винятків, не­однозначність та велику надлишковість природної мови. Наприклад, у російській мові надлишковість досягає 75-85 %.

Основними елементами ІПМ є алфавіт, лексика, граматика, па­радигматичні (базові) відношення, правила побудови індексів та їх ідентифікація.

Алфавітом називається система графічних знаків, що використо­вуються для фіксації слів і словосполучень мови.

Лексика мови - це сукупність слів, що використовуються в ній.

Граматика - це сукупність діючих засобів та правил побудови висловлювань засобами цієї мови.

Для зберігання документів у бібліотеках і технічних архівах використовують мови, якими поширюються традиційні бібліотеч­но-бібліографічні класифікації. Словниковий склад цих мов зада­ється у вигляді фіксованого списку слів і словосполучень. Ці мови належать до класифікаційного типу, причому розглядаються такі системи класифікації: ієрархічна, алфавітно-предметна, фасетна.

Більш поширені інформаційно-пошукові мови дескрипторного типу. Ця мова характеризується тим, що її словник складається із окремих ізольованих слів і словосполучень, розміщених в алфавіт­ному порядку. Дескрипторна мова ґрунтується на методі коорди­натного індексування, який дає змогу виражати зміст документа шляхом встановлення відповідності між текстом цього документа і деякою множиною ключових слів чи дескрипторів. Тому дескрип-торні мови називають посткоординованими, а в противагу їм традиційні бібліотечно-бібліографічні мови належать до передко-ординатних. До посткоординатних мов належать дескрипторні мо­ви, а також семантичні коди та синтагматична мова.