Определение понятия тезауруса

ВЛАДИМИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Имени Александра Григорьевича и Николая Григорьевича Столетовых

 

КАФЕДРА БИЗНЕС-ИНФОРМАТИКИ И ЭКОНОМИКИ

 

Реферат

по дисциплине «Базы данных»

на тему: «Тезаурусные документальные модели данных»

 

 

Выполнил:

студент 3-го курса

группы БИк-214

Липатов Е.В.

 

Принял:

Виноградов Д. В.

Владимир 2016

Содержание

Определение понятия тезауруса…………………………………………………3

Использование информационно-поисковых тезаурусов……………………….5

Принцип работы тезаурусов в ИС и требования для них………………………6

Пример реализации тезаурусной системы на примере ИСИР…………………8

Заключение……………………………………………………………………….11

Список литературы………………………………………………………………12

Определение понятия тезауруса

Тезаурус (от греч. thesaurós — сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений.

Тезаурус фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Первоначально Тезаурус рассматривали как одноязычный словарь, в котором семантические отношения определяются группировкой слов по тематическим рубрикам. Например, английский Тезаурус (автор П. М. Роджет), изданный в 1962 (1-е издание 1852), содержит 1040 рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к этому Тезаурус содержит алфавитный перечень слов с указанием рубрик и подрубрик, к которым относится каждое слово. Существуют традиционные общеязыковые Тезаурус (описания семантических систем отдельных языков) для английского, французского, испанского языков. К Тезаурус весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова, например словарь русского языка С. И. Ожегова. В 70-х гг. 20 в. получили распространение информационно-поисковые Тезаурус. В этих Тезаурус выделены специальные лексические единицы — дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого Тезаурус сопоставляется синонимичный дескриптор (см. Синонимия), и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д. Обычно принято разделять родо-видовые (иерархические) и ассоциативные отношения. Так, «Информационно-поисковый тезаурус по информатике», изданный в СССР в 1973, для каждого дескриптора предусматривает словарную статью, где отдельно указаны синонимичные ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей ориентации в ассоциативных связях между дескрипторами к этому Тезаурус приложены семантические карты тематических классов. При автоматизированном информационном поиске ищутся документы, у которых индекс содержит не только дескрипторы запроса, но и те дескрипторы, которые находятся с ними в определённых семантических отношениях. Иногда бывает полезно выделять в Тезаурус конкретные ассоциативные отношения, специфичные для данной тематической области: болезнь — возбудитель, прибор — назначение (или измеряемая величина) и т. п. Положение лексической единицы (слова, словосочетания) в Тезаурус характеризует его смысл в языке; знание системы семантических отношений, в которые вступает данное слово (в том числе и рубрик, куда оно входит), позволяет судить о смысле этого слова. В широком смысле Тезаурус интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приёмника дополнительной информации, вследствие чего изменяется и его Тезаурус Исходный Тезаурус определяет при этом возможности приёмника при получении им семантической информации. В психологии и при изучении систем с искусственным интеллектом рассматривают свойства Тезаурус индивидуумов, проявляющиеся при восприятии и понимании информации. В социологии и теории коммуникаций изучают свойства Тезаурус индивидуумов и коллективов, обеспечивающие возможность взаимопонимания на основе общности Тезаурус. В этих ситуациях в Тезаурус приходится включать сложные высказывания и их семантические связи, определяющие запас сведении, которыми располагает сложная система. Тезаурус фактически содержит не только информацию о действительности, но и метаинформацию (сведения об информации), обеспечивающую возможность приёма новых сообщений.