Семантический поиск (Semantic Search)

Многие в семантический поиск вкладывают самое разное значение. В данном случае поиск идет по смыслу поискового запроса. Смысл в том, что у очень многих поисковых запросов есть возможность их 100% соотношения с тем, что же ищется.

Например, поиск по ключевым словам “Нижний Новгород”, однозначно идентифицирует город Нижний Новгород и в поисковой системе нового поколения может отображаться как вкладки:

- статьей о городе в ВикиПедии (или уже в едином проекте на базе Linked Data);

- картой города;

- основных связанных с городом понятий: регион - Нижегородская область, глава города, ключевые достопримечательности и так далее;

- основная статистическая и справочная информация по городу.

И, в отдельной вкладке, результаты поиска по вебу.

Фактически семантический поиск - это разделение всей информации на доверенные/структурированные источники и всему остальному массиву недоверенных источников.

Семантическое внедрение (Semantic Embedding)

Это не совсем алгоритм, а точнее это бизнес альтернатива алгоритмам распознавания и выявления шаблонов. Он заключается в поиске ответа на вопрос: Как обеспечить структуризацию данных, когда пользователи ленятся или нехотят делать это сами?

Ответ в том что между потребителями структурированной информации в большинстве своём являются информационные и медиа компании (Google, Yahoo, Yandex, News Corp. и так далее) и между рядовыми пользователями сети есть значительная прослойка разработчиков систем и сервисов. Популяризуя SIOC, FOAF, AML, OPML и другие технологии среди них, а также спонсируя поддержку их продуктов, формируется рынок информации на котором, конечно, будут и новые игроки. Но основной выигрыш смогут извлечь компании уже обладающие организационной и технической инфраструктурой. Так распространение RSS уже привело к появлению сервисов blogsearch.google.com и blogs.yandex.ru, а популяризация других форматов приведёт и появлению других.

В этом же ответе и кроется одна из причин растущей популярности OpenSource и постепенному падению интереса к технологиям. Информационные и медиа компании, в своём подавляющем большинстве, технологически агноститичны. По большому счёту им всё равно на каких технологиях работают их продукты, главное лишь это не зависеть от поставщиков этих технологий слишком сильно.

Однако, не имеет никакого значения какую базу данных, язык разработки и движок использует веб ресурс, главное чтобы он отдавал информацию в понимаемых другими форматами.

Реализации Semantic Web

Уже сегодня практически все известные компании уровня IBM, Adobe или Sun Microsystems, активно используют технологию Семантического веба в своих продуктах для решения задач управления данными.

Компания Microsoft инвестирует сотни миллионов долларов в проект взаимодействующих сетевых ресурсов .NET, который отражает их представление о ближайшем будущем Internet. Создаваемая система позволяет проводить автоматизированный обмен сетевыми ресурсами между отдельными программами, приложениями, базами данных, пользователями, основываясь на XML, как на ключевой технологии.

В Европе ведется проект, подобный Семантическому вебу, - "Сеть знаний", Knowledge Web. Эта сеть ориентирована на нужды информационных технологий в промышленности, науке и образовании, а Семантический веб (поддерживаемый и в Европе - SWAD-Europe) больше рассчитан на электронную коммерцию и упрощение работы пользователей сети Интернет.

Недавно в рамках идеологии Семантического веба в School of Electronics & Computer Science (ECS - Школа электроники и Компьютерных технологий) Университета Саутгемптона была разработана система mSpace. Программное обеспечение этой системы представляет собой набор мощных инструментов, позволяющих собирать данные из различных источников и организовывать информацию по категориям и дающих возможность пользователю свободно ориентироваться в ней.

Разработчики приводят следующий пример. Например, если в Google набрать "классическая музыка", то поисковик выдаст ссылки на сайты, так или иначе касающиеся классической музыки. Если же искать "классическую музыку" на mSpace, то будет выдан список композиций, которые можно тут же скачать. Другой пример - по запросу "Гарри Поттер" пользователь получит не просто набор ссылок, а отсортированный отчет, в котором часть ссылок будет лежать в графе "фильмы", другая часть - в колонке "книги", а третья - в колонке "рецензии". Семантический веб предоставит пользователю возможность выбирать, в каком направлении исследовать информацию, а не просто выдавать самое подходящее по общему алгоритму.

Может быть, благодаря Семантическому вебу Internet сможет выйти из намечающегося кризиса, связанного с "проблемой размерности". Появилась надежда, что компьютеры смогут обрабатывать данные в соответствии с их смыслом, следуя по гипер-ссылкам, ведущим к определениям ключевых терминов и правилам логических выводов. Полученная в результате инфраструктура даст отправную точку для разработки автоматизированных веб-сервисов, интеллектуальных агентов, ведь сама идея Семантического веба основана на стремлении "научить" компьютерные программы, веб-службы и роботы поисковых систем и агентов "осмысленно" оперировать той информацией, для которой последние были созданы.

Семантический веб обещает вполне ощутимые преимущества, дополнительные сервисы. Навигация в Сети станет более осмысленной, а поиск - более точным. Сами пользователи смогут создавать страницы Семантического веба, давать собственные определения и вводить новые правила вывода, используя стандартное для этой сети программное обеспечение.

Семантический веб - это не какая-то отдельная сеть, а расширение и эволюция уже существующей, но при этом информация снабжена точно определённым смыслом, позволяющим человеку и программам успешно взаимодействовать. Сегодня происходит активная интеграция новых элементов Семантической Сети в структуру традиционного веба. Семантический веб уже вполне готов к широкому внедрению в корпоративном секторе, он перерос границы чисто исследовательского проекта, все его основополагающие технологии становятся стандартами, а крупные участники рынка высоких технологий внедряют их в прикладные программы корпоративного уровня.

В настоящее время на Семантический веб работает множество научных подразделений по всему миру, совершенствуя и разрабатывая новые протоколы, технологи, среды программирования, языки, пользовательские интерфейсы, методы распределенного поиска знаний.