Поисковые системы и их информационные ресурсы

Поиско́вая систе́ма — это программное обеспечение, состоящее из базы данных документов, снабженной пользовательским интерфейсом, которое разработано для поиска информации во всемирной паутине. Пользуясь поисковой системой, пользователи составляют свои собственные поисковые запросы с ключевыми словами[1], а не используют заданные системой пути поиска[2].

Результаты поиска обычно представлены в серии результатов, часто называемых страницами результатов поисковой системы. Информация может быть совокупностью веб-страниц, изображений и других типов файлов. Основная задача поисковой системы заключается в выборе наилучшего возможного подмножества в ответ на конкретный запрос, то есть множества документов, которые наиболее соответствуют тому, что ищет пользователь (обычно в порядке убывания релевантности)[3]. Полноценность поисковой системы зависит от релевантности результатов, которые она предоставляет.

По методам поиска и обслуживания поисковые системы разделяют на 4 типа: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы[⇨]. Сам механизм поиска состоит из трёх ключевых частей: поисковый робот, индексатор, поисковик[⇨].

По состоянию на 2014 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России Яндекс обгоняет Google больше, чем на 10 %[⇨].

Поисковые системы созданы, чтобы находить и выдавать пользователю релевантную информацию, но есть понятие пузырь фильтров[⇨]. Оно объясняет почему пользователь может не получить некоторую информацию. Так же стоит учитывать факт влияния различных факторов, таких как политические, экономические или социальные[⇨].

Интернет развивался как средство общения и удаленного доступа, поэтому первыми службами глобальной сети являются электронная почта, telnet, FTP. В дальнейшем в сети появились другие сервисы. С появлением распределенной системы гипермедиа Word Wide Web сеть Интернет стала средством массовой информации.

В настоящее время в глобальной сети размещен огромный объем информации по различным направлениям деятельности. Основной объем информационных ресурсов в виде веб-страниц или файлов в формате html находится на веб-сайтах, размещенных на Web-серверах Интернета. Просмотр веб-страниц этих сайтов осуществляется при помощи прикладных программ браузеров (обозревателей).

Кроме того, в Интернете находится много информационных ресурсов (различных типов файлов), которые размещаются на многих серверах, например на FTP-серверах (файлы компьютерных программ, технических описания), в архивах GOPHER (файлы текстов литературных произведений), в базах данных ARCHIE на ARCHIE-серверах, в WAIS-библиотеках (материалы в области исследований и информационных технологий), на серверах баз данных (информация о владельцах доменных имен) регистраторов IP-адресов и регистраторов доменных имён и т.д.

Быстрый рост объема информационных ресурсов привел к необходимости создания специальных поисковых средств: первая поисковая система Archie для поиска файлов в базах данных ARCHIE (помогает находить файлы, хранящиеся на анонимных FTP-серверах), система Gopher, система WAIS в базе данных, которых содержится индексированная информация о ресурсах сети Интернет, поисковые системы или поисковые машины, которые выполняют поиск WWW-страниц на Web-серверах.

Поисковые системы в Интернете для поиска ресурсов могут быть разделены на следующие группы:

· системы Web-поиска;

· системы поиска FTP-файлов (например, (http://www.filesearch.ru);

· системы поиска в архивах Gopher;

· системы поиска в Usenet;

· каталоги информационных ресурсов;

· порталы информационных ресурсов.

Средства поиска информационных ресурсов в Internet подразделяют на:

· поисковые машины, системы поиска, которые осуществляют поиск по ключевым словам;

· каталоги и порталы информационных ресурсов сети, которые имеют иерархическую структуру для навигации или быстрого поиска информации не по ключевым словам, а по директориям.