Средства поиска информации в глобальной сети

Министерство образования и науки Российской Федерации

СОЧИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Инженерно-экологический факультет

 

Кафедра информационных технологий

специальность 230700 - Прикладная информатика (в экономике)

Отчет

по дисциплине «Управление информационными ресурсами»

на тему: «Стратегия и тактика поиска информации. Обзор и анализ поисковых систем»

 

 

Выполнил: Гюламирян А.Р.

Группа: 14-ПИ

 

 

Проверил:

Мацканюк А.А.

 


Оглавление

Введение. 3

Задачи и стратегии поиска. 4

Средства поиска информации в глобальной сети. 6

Язык поисковых запросов. Применение языка запросов. 11

Владение пользовательскими инструментами и техникой. 14

Заключение. 16

 


Введение

Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По различным данным, в 2004 г. количество пользователей глобальной системы Интернет составило от 600 до 900 миллионов человек. Это число продолжает стремительно расти и уже в 2006 г. оно достигло миллиарда человек. Сегодня глобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологий появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым.

Поиск в компьютерных сетях становится искусством и требует вполне определённых знаний, которыми современному человеку необходимо овладеть. Я выбрала данную тему реферата, так как считаю что одной из составляющей грамотной работы в Интернет является умение работать в глобальной сети. И для того, чтобы не утонуть во всём изобилии информации необходимо научиться не только её искать, но и находить.


 

 

Задачи и стратегии поиска

Прежде чем начать поиск следует четко сформулировать задачу. До тех пор, пока задача не будет сформулирована об успешности, а тем более оптимизации поиска, не может быть и речи. Объем информации в Интернете слишком велик, и как нигде здесь верна поговорка «Время - деньги». Поэтому в здесь нельзя искать по принципу «Пойди туда, не знаю куда. Возьми то, не знаю что». Иначе результат будет плачевный.

Дать общий рецепт эффективной стратегии поиска информации в Интернет, пожалуй, невозможно. Есть лишь некоторые принципы, позволяющие тратить меньше времени. Вот некоторые из них. Например, вам необходимо узнать, где обитает трёхлапый ленивец, то вряд ли вы пойдете в алфавитный каталог библиотеки. Может быть, вы найдете нужную литературу с помощью систематического каталога. С несколько большей вероятностью - с помощью предметного. Но, скорее всего, ни один из библиотечных каталогов вам не поможет. Но, зайдя в информационно-библиографический отдел крупной библиотеки, дежурный библиограф достанет библиографический указатель по животным или какую-то похожую книжицу, из которой вы и найдете ответ на свой вопрос. Подобную стратегию можно с успехом применять и в Интернет. В ИПС(информационно-поисковых сетях) общего назначения можно утонуть в тысячах ссылок, выданных вам на простой запрос. Целью использования универсальной ИПС общего назначения может быть поиск специализированной ИПС, посвященной тематике вашего поиска. Такая ИПС может быть распознана по наличию слов "информация (information)", "документ (document)" и т.п. Но часто специализированная ИПС может скрываться на сервере общественной, профессиональной или специализированной организации, издательства.

Этот пример иллюстрирует еще один элемент стратегии: читайте найденные документы в поисках наиболее точных терминов и связей между терминами. Возможно, вы мыслите в совершенно не тех терминах, которые используют авторы искомых документов (ведь большую роль играют культурные различия!).

Третий элемент стратегии: используйте несколько ИПС. Если вы регулярно занимаетесь поиском информации по какой-то тематике, отметьте те ИПС. которые для вас наиболее эффективны.

 


 

Средства поиска информации в глобальной сети


По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машины.

Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т.д.), где каждая тема разветвляется на несколько подуровней. Особенность этих средств поиска информации состоит в том, что создание структуры, базы данных и их постоянное обновление осуществляется "вручную", коллективом редакторов и программистов, и сам процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего от ссылки к ссылке. Основное достоинство поисковых каталогов ресурсов в том, что накапливаемая в них информация тщательно отбирается, сортируется, разбивается на отдельные категории.

Все каталоги построены по единому принципу. Страницы каталогов содержат тематические классификаторы. На стартовой странице располагается тематический каталог высшего уровня. Под каждой категорией каталога могут быть развёрнуты подкатегории. Посредством щелчка на одной из тематических ссылок открывается страница с тематическими категориями более низкого уровня, которые, в свою очередь, тоже разбиваются на подкатегории. Все категории и подкатегории соответствующим образом выделяются.

Каталоги организованы по иерархическому принципу и устроены в виде тематического дерева, корнем которого служит начальная страница каталога, содержащая определённое количество тематических ветвей. Перемещаться по тематическому дереву вверх или вниз можно посредством щелчков на именах страниц. Страницы большинства каталогов содержат специальные элементы – индексы, на которых расположены ссылки на узлы, относящиеся к данной тематике. Если щёлкнуть на одной из ссылок, то появится окно, в котором продемонстрирована организация данной ветви тематического дерева. Это ускоряет просмотр тематических категорий и подкатегорий.

Одним из наиболее известных каталогов является Yahoo! Страницы этого каталога содержат множество тематических категорий, организованных по иерархическому принципу. Категории на всех уровнях разветвляются на подкатегории. Корнем служит начальная страница каталога, содержащая 14 тематических ветвей. Перемещаться по тематическому дереву вверх или вниз можно посредством щелчков на именах страниц. На страницы Yahoo! встроены индексы всех Web-ресурсов, относящихся к данной теме. Все каталоги и подкатегории выделены полужирным шрифтом, а гиперссылки на существующие Web-сайты выделены подчёркиванием. На каждую страницу Yahoo! Вмонтированы специальные символы:

  1. число, стоящее в круглых скобках около категории, указывает на количество ссылок в категории.;
  2. обозначение @ говорит о том, что подкатегория входит в состав нескольких категорий;
  3. слово new свидетельствует о том, что ссылка была добавлена недавно;
  4. значок с изображением очков указывает на интересную или полезную, по мнению администрации сайта, ссылку.

 


Механизм поиска Yahoo! Можно активизировать на любой из страниц каталога. Для поиска в пределах всего каталога или одной из страниц используются специальные переключатели и поисковое окно. Поиск в Yahoo! Производится в соответствии с типом адресов, выбираемых с помощью опций меню (размещённого под поисковым окном). Кроме системы адресации, используемой тематическим каталогом, существует возможность обращения по адресам информационной службы Usenet, а также электронной почты. При выборе опций меню Yahoo! Поиск ведётся среди Web-узлов, включённых в каталог служб новостей, относящихся к данной тематике.

В Internet размещаются узлы и других каталогов, снабжённых поисковыми системами, подобными поисковым системам Yahoo!

Ниже перечислены некоторые поисковые каталоги:


  • Excite (www.excite.com);
  • Брама (www.brama.com);
  • Everyday (www.everyday.com.ua);
  • UP.RU (www.up.ru);
  • Elvisti (www.el.visti.net);
  • @Rus (www.atrus.ru);
  • List.ru (www.list.ru);
  • Weblist (www.weblist.ru);
  • Созвездие (www.stars.ru);
  • Улитка (www.ulitka.ru);
  • Иван Сусанин (www.susanin.ru);
  • MavicaNet (www.mavikanet.ru).

 

Главный недостаток поисковых каталогов Web-ресурсов в том, что их поисковые системы извлекают огромное число документов, не соответствующих вводимому запросу. Как правило, документы, которые находятся в конце списка, содержат мало полезной информации. Ключевые слова могут быть истолкованы системой поиска совершенно в ином контексте либо отвечают нескольким толкованием.


Поисковые машины. Для детального поиска документов используются специализированные поисковые системы – поисковые машины. Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет.

При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.

Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.

В настоящее время в отечественных ресурсах действует довольно много поисковых машин. Есть фирменные и даже индивидуальные сайты, которые включают те или иные поисковые машины. Поисковые элементы существуют практически на всех Интернет-газетах и учебных порталах.

Наиболее распространённые из поисковых машин представлены ниже:

 


  • Яndex (www.yandex.ru);
  • Апорт (www.aport.ru);
  • МЕТА (www.meta-ukraine.com);
  • Rambler (www.rambler.ru);
  • UANET (www.uanet.com.ua);
  • EIVisti (www.el.visti.net);
  • SEARCH (www.search.kiev.ua);
  • Pathfinder (www.pups.kiev.ua);
  • Tela-поиск (www.tela.dux.ru);
  • Openweb (www.openweb.ru);
  • АУ (www.au.ru).

 

Существует некоторые причины, по которым документ не может быть обнаружен. Прежде всего, требуемое не будет обнаружено поисковой машиной, если на ней данные ресурсы не прописаны. Необходимо запомнить, что недостаточно разместить что-либо в Интернете, необходимо прописать это на соответствующих поисковых машинах. Можно расположить материал в Интернете, знать его адрес. Однако, пока он не «прописан» на одной из поисковых машин, найти его будет очень сложно, конечно, если ему не дан адрес. Через некоторое время и этот сайт будет обнаружен так называемыми «поисковыми роботами» или «пауками-поисковиками» и, только тогда, возможно, он начнёт посещаться.

Впрочем, есть возможность программно запретить регистрацию всего сайта, или отдельных элементов его, как всеми, так и определёнными поисковыми системами. Для подобных целей служат так называемые мета-теги или мета-определители. Однако это отдельный разговор, кем и с какой целью подобное запрещение делается.

Следующее - это специализация поисковых машин. Так, например, top100 относится к поисковым машинам специализированного типа и больше предназначена для поиска технических элементов компьютеров и справок по ним. Поисковые машины km.ru, yandex.ru, rambler.ru, относятся к группе общего назначения. Именно с них следует начинать поиск в Интернете. Причем, поисковая система «Кирилл и Мефодий» на km.ru все же чаще используется для розыска материалов в разного рода энциклопедиях и учебных пособиях, словарях, которые вышли после 1990 г. На AltaVista – пожалуй наиболее полно представлены материалы, связанные с коммерческой деятельностью, Google – более специализируется на оперативных новостях. На машинах Fast, Инфоарт, Русский интернет и Aпорт часто можно бывает найти информацию, связанную с куплей-продажей. Следует также учитывать, что полностью адрес поисковых машин обычно включает префикс и выглядит примерно так: http://www.dig.ru. Некоторые поисковые системы используют чужие поисковые системы. Так система поиска mail.ru на сегодняшний день использует поисковую машину rambler.ru, но выводит информацию в собственном интерфейсе.