Автоматизація патентно-інформаційної діяльності.
Розробка нової техніки неможлива без патентної інформації.
Цінність патентної інформації-тільки 10% нових технічних рішень, які є в патентних документах, можна знайти в інших джерелах науково-технічної інформації. Підвищення ефективності в-ва та економіки країни значною мірою визначається якістю інформаційного забезпечення. 5млн. статей, 1млн. патентів, а загальний потік науково-технічної інформації-10млн. одиниць в рік. На одного інженера в світі біля 1500 сторінок тексту в день. Затрати на систему наукової інформації в США-1/4 витрат на наукові дослідження. Втрати від недостатньої інформованості керівників в різних галузях народного господарства країни складають-5% національного доходу.
Автоматика, телемеханіка, обчислювальна техніка, приладобудування-70-80% публікацій в патентній інформації. По даним, в США та Німечині кожна десята НДР дублюється.
Патентно-інформаційна діяльність-збір, збереження, пошук та розповсюдження патентної інформації, а також її аналітико-систетична переробка задачі , інформаційне забезпечення розробників нової техніки; узагальнення даних для прогнозування розвитку наук.-техн. прогресу; виявлення перспективних напрямів в окремих предметних областях; вдосконалення засобів та методів інформаційного забезпечення.
Найбільш суттєвий напрям підвищення ефективності патентно інформац. діяльності-камплексна автоматизація функцій та процесів. Суть цих процесів-однократний ввід даних та їх багатократне використання, в тому числі в режимі мереж.
Інформаційна система – інтегрована обробка даних, системи колективного користування, бази даних, діалоговий режим роботи. Тепер ці системи стали інформаційно-пошуковими системами (ІПС) і автоматизованими. ІПС можуть бути двох типів: класифікаційні і дескринторні. В класифікаційних масив даних розглядається як деяка впорядкована структура, побудована по заденому принципу (УДК,МКВ). В дескриптор них пошук здійснюється по ключовим словам, які утворюють тезаурус даної системи. Ознака системи визначається видом пошуку, який здійснюється в системі.
Види патентного пошуку:тематичний (дескрипторні системи), іменний, нумераційний (класифікаційні системи).
Інформаційний запит на Документ, релевантний
пошуковому
природній мові
|
|
|
|
Рис. 1. Дескрипторна ІПС.
Рис. 2. Автоматизована інформаційна система.
Релевантність – відповідність. Дескриптори – сукупність ознак, які характеризують предмет пошуку.
Функції адміністратора бази даних-захист та збереження даних, секретність управління і доступу до інформації.
В СУБД виділяють три рівні представлення даних-концептуальний, внутрішній, зовнішній. Широко розповсюдження набувають процеси автоматичного індексування.
Методи аналізу текстів:
1) позиційний-“вага”слів залежить від “позицій”в тексті;
2) метод заголовків-основний зміст в заголовках;
3) статистичний-залежність між частотою використання слова в тексті і його значимістю;
4) синтаксичний-лінгвістика тексту;
5) метод локалізації-найбільш інформативні є певні місця тексту.
Послідовність операцій автоматизованого патентного пошуку.
- індексування запиту, тобто виділення пошукових ознак;
- складання пошукового плану та визначення стратегії пошуку;
- ввід пошукового плану в базу даних;
- аналіз проміжних результатів та заповнення копій;
- отримання повного друкованого звіту.
Патентною інформацією володіють організації двох типів:патентні відомства, державні та комерційні інформаційні фірми. Найбільш потужні патентно-інформаційні фірми: ІНПАДОК(INPADOC)-Австрія; CAS,BRSS,DC:-США;
ПЕРГАМОН (PERGAMON)-Великобританія; ДЕРВЕНТ (DERWENT).
В Зах. Європі є ряд фірм,які здійснюють доступ до великого числа баз даних, які належать різним власникам:(США) Dialog,Information,Service,Inc-250 баз даних, BRS-84 бази, SDC-System,Dewlopment,Co-66 баз.
Інформаційні технології:
1) зберігаючі-економія праці,часу,ресурсів (управлінські,пошукові,передача інформації);
2) раціоналізуючі-автоматизовані системи замовлення квитків,бронювання місць,фінансових розрахунків;
3) створюючі (творчі)-системи переробки та використання інформації, які включають людину як складову частину, так званий “мозковий штурм” проблеми з використанням БД,ЕОМ, моделювання, статичних матеріалів.
Розвиток технічних засобів інформатики має два напрями:
1) розробка та створення великих та малих ЕОМ;
2) розвиток мереж передачі даних.
Досконала система патентного пошуку забезпечує:
- прямий доступ до пошукових масивів в діалоговому режимі;
- включення в базу даних як текстової, так і графічної інформації;
- пошук по всім бібліографічним елементам, в т.ч. індекси МКВ, повному тексту заголовку, реферат, основний пункт формули винаходу;
- ввід, корректування та вивід даних в режимі прямого доступу;
- забезпечення передачі даних по каналам зв”язку та вивід даних на друк.
Розвиток технології оптичних дисків (ОД):
1.Відеодиски“Lazervizion” 1981р. ф=30см, на кожній стороні до 54тис. відео зображень. Пошук по порядковому номеру кадра. Основний недолік-необхідність трансформації телевізійних стандартів. Невисока роздільна здатність.
2.CD-компактні аудіо диски.
3.CD-ROM-Compact Disk-Read Only Memory-80р. ф12см.=600Мбайт інформації=12тис. сторінок тексту.інформаційна ємність CD-ROM=300Мбайт (все інше довідково-пошуковий аппарат до інформації).
4.CD-I. Фірми “Philips” та “Sony”. Це є комплексний носій, який включає текстову, звукову та графічну інформацію. Мікропроцесор програвача дозволяє розділити різні види інформації.
5.Цифрові оптичні диски (DОD). Технологія OROM (optical…) ф9,13,20см. Запис і відтворення з постійною кутовою швидкістю (CD-ROM постійна лінійна швидкість). Ємність –250-350Мбайт, але швидкість пошуку в 10 раз більша, ніж на CD-ROM. Підтверджені дані про 50-літній термін зберігання даних на ОД.
Оптичні запам’ятовуючі карти-880стор. тексту записують на 35-мм полосі по кредитній карті. Основна перевага-вартість-1$.
Фірма “Trans-Zingual” (США)-жорсткі магнітні диски. Зберігання в 4 рази надійніше, вартість-набагато менша.
Основна вимога при патентному пошуку- повнота, але пошук по повним текстам має високий рівень інформаційного шуму. Необхідність проглядати велику к-сть не релевантних документів часто робить весь пошук беззмістовним. Вихід – створення двох-трьохконтурних IC з взаємодоповнюючим базами даних різних типів.Одна БД дає можливість отримати 50-60% потрібної інформації. Режим перехресного пошуку (“crossfile”)-безпосередній доступ до декількох БД без необхідності повторно вводити пошукові терміни.Діє в потужних інформаційних мережах.
2 Файл з даними Файл
|
3
4 Електронні
5 публікації,
Публікації
7 на папері.
|
|
Інформація
|
Електронні
дані
Папір
Рис.3. Схема діловиробництва в патентному відомстві Японії:
1-отримання заявки; 2-заявки та зміни; 3-діалоговий режим; 4-ОД; 5-паперові носії; 6-відправлення; 7-діалоговий режим; 8-пошта(паперовий носій); 9-інформація про публікації; 10-публічна бібліотека; 11-патентна бібліотека; 12-діловиробництво по заявкам; 13-заявки; 14-зміни; 15-автоматизовані засоби; 16-експертиза та повторна експертиза; 17-документи при визначенні рівня техніки; 18-пошук.
Важливий момент – дієздатність електронної інформації як юридичного документу.
Складові довільної мережі:
1) Фізична мережа, яка складається з комутаційних процесорів та каналів зв”язку;
2) Потік повідомлень,якій рухається по мережі у відповідності з методом передачі з проміжним зберіганням;
3) Множина операційних правил, по яким обробляється потік повідомлень.
Програмні засоби спряження ПЕОМ з мережею мають наступні рівні:фізичний,електричний,логічний та процедурний.
Протокол – система програмних засобів для повного спряження ОС мережі –спеціальне програмне забезпечення мережі.
Інформаційна мережа (ІМ).
ІМ – інформаційний центр та мережа передачі д аних. Мережа з комутацією каналів – телефонна мережа.
Наступний етап – комутація повідомлень,тобто з”єднання відбувається в момент передачі інформації.
Метод пакетної комутації – повідомлення розбивається на окремі блоки фіксованої довжини. Кожний блок має службовий підблолк, який включає адрес доставки. Пакети передаються по принципу нагромадження та відправки при наявності шляхів проходження.
Основна перевага – між відправником та отримувачем немає фізичного з”єднання, а пакети від різніх користувачів по рідним шляхом передаються адресату. На примальній стороні з пакетів збирається повідомлення. Комутаційний процесор (вузол) записує вхідні інформаційні пакети в пам”ять даних, де вони зберігаються до отримання підтвердження. Вузол перевіряє ці пакети на наявність помилок, і по адресу призначення передає їх при наявності лінії. Пересування пакетів по мережі відбувається “стрибками” від одного вузла до іншого. Якщо “сусід” приймає пакет (тобто не має помилок і є місце в пам”яті),то він направляє назат “квитанцію” про успішну передачу пакету. Якщо “квитанції” немає на протязі таймауту, то передача пакету повторюється.
Категорії обслуговування пакетної комутації:
1) Датаграмне – пакети від джерела інформації поступають в мережу і направляються далі в порядку, не залежному від їх надходження в мережу. Тому на приймальному пункті треба провести впорядкування пакетів для відтворювання повідомлення.
2) Віртуальне – з допомогою спеціальної сигналізації спочатку для пакету вибирається маршрут в мережі.
Задача мережі – забезпечити поступлення пакетів даних до місця призначення в правельній послідовності. Фізичне з”єднання між відправником та отримувачем може в даний момент бути відсутнє, але пакет передається по так званому віртуальному шляху і наближається до отримувача. Може бути декілька віртуальних шляхів. Тут головну роль відіграє спеціальна процедура сигналізації.
Діалог комп”ютерів неможливий без процедурних правил. З точки зору формальних процедур взаємодії комп”ютерна мережа – множина дистрибутивних процесів, які організовані в деяку ієрархічну структуру. Протоколи, тобто формальні правила, дозволяють узгодити взаємодію в мережі ком п”ютерів, терміналів, комутаційних вузлів та апаратурі передачі даних. Весь процес взаємодії в мережі представляє собою ієрархію рівнів. В світі розроблена ієрархія з семи рівнів, в яку вкладається всі можливі процедурні правила та дії. Підсистема однорго рангу на кінцях мережі створює відповідні рівні. Взаємодія в окремих підсистемах визначається своїми протоколами, а сусідні рівні (по вертикалі) взаємодіють один з одним через міжрівневий інтерфейс.
По міжнародній стандартизації розглядаються наступні рівні:
1. Фізичний-здійснюється керування фізичним каналом, тобто визначає електричні та механічні характеристики підключення до апаратури передачі сигналів канала зв”язку (велечени напруг, довжина імпульсів). Якщо виконані умови першого рівня, то можна переходити до виконання правил наступного.
2. Канальний-організовує канал, слідкує за його з”єднанням та роз”єднанням. Він забезпечує передачу даних через апаратуру в канал.
3. Мережевий-виконує ф-ції маршрутизації інформації, адресації та керує потоколами інформації.
4. Транспортний-відповідає за передачу даних від джерела до адресата. Вказаних чотири рівні визначають транспортний сервіс.
5. Сеансовий-забезпечіє проведення сеансів зв”язку, їх пітримування та закінчення.
6. Представницький- відповідає за взаємодію процесів, представляє дані у відповідності з програмою користувача.
7. Прикладний-відповідає за виконання програм користувача, змістом яких є інформаційно-довідникові або обчислювальні роботи.
HDLC-High Level Data Link Control Procedure-міжнародний протокол керування інформаційним каналом. Х.25-стандарт для протоколів трьох нижніх рівнів.