Популярные поисковые системы 2 страница

б)
а)

Рис. 40. Каталог Open Directory: а — начальная страница;
б — один из разделов каталога

Каталог самой популярной в мире поисковой системы Google расположен по адресу directory.google.com (рис. 41). Формирование каталога начинается со ссылок Open Directory, отобранных редакторами, после чего применяются специальные запатентованные компанией технологии ранжирования страниц и определения их важности. В каталоге слева от каждого адреса отображается полоса-индикатор, обозначающая важность данной ссылки в понимании Google.

Рис. 41.Каталог Google: а — начальная страница;
б — один из разделов каталога

Из англоязычных каталогов также следует отметить каталог Yahoo!, с которого и начала победное шествие к вершинам популярности эта компания (dir.yahoo.com — рис. 42).

Однако все же большинство пользователей успешно справ­ляются с задачей поиска нужной им информации с помощью специальных поисковых веб-серверов. С помощью специальной сервер-программы такие серверы ежедневно просматривают интернет-пространство с целью выявления новых веб-серверов, удаления информации о серверах, прекратив­ших существование, сбора информации о новых веб-стра­ни­цах и изменениях существующих, удаления информации об исчезнувших веб-страницах.

Вся найденная информация сортируется и сохраняется в специализированной базе данных на поисковом сервере. Другая программа-сервер работает с запросами, поступающими от пользователей сети Интернет. Она производит поиск в базе данных и возвращает пользователю список ссылок на те веб-страницы, где обнаружен контекст запроса.

Рис. 42. Каталог Yahoo!: а — начальная страница;
б — один из разделов каталога

 

Поисковые машины, или автоматические индексы — это роботизированные системы (search engines). Специальная программа-робот, которую называют паук (spider), постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

Важными показателями качества поисковой машины являются объем базы данных (количество документов), скорость обхода Сети (с этим связана скорость обновления информации в базе данных), алгоритм индексации (только по ключевым словам веб-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам, html-заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные возможности (расширенный поиск, поиск похожих документов, ограничение области поиска), удобный пользовательский интерфейс и справочная система.

Первые версии программ полнотекстового поиска предполагали сканирование полного содержимого всех документов в поиске заданного слова или фразы. При использовании такой технологии поиск занимал очень много времени (в зависимости от размера базы) и в Интернете был бы невыполним. Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нем — и тогда сразу же будет получен список документов, в которых они встречаются.

Мощная поисковая машина обходит сеть за несколько дней. При этом составляется весьма свежий и довольно подробный индекс — опись доступных ресурсов. При каждом новом цикле обхода индекс обновляется и старые недействительные адреса удаляются. Однако автоматизированный подход приводит к тому, что в индекс могут попасть дубликаты (один и тот же документ на разных сайтах, в разных кодировках).

В том случае если веб-страницы состоят из нескольких кадров-фреймов, поисковые машины индексируют каждый кадр отдельно. При проведении автоматической индексации поисковики не переходят по адресам, встречающимся в теле веб-страниц. Кроме того, часть Интернета для поисковых машин закрыта — например, информация, доступ к которой осуществляется по паролю, базы данных, до­ступ в которые осуществляется по запросу из формы (а не по ссылке), и др.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

 

 

Популярные поисковые системы

Самой популярной является поисковая система Google. Она обрабатывает более 40 млрд (!) поисковых запросов в месяц. Популярность сервиса даже привела к образованию, как в английском, так и в русском языках неологизмов — глаголов «to google» и «гуглить» — искать в Сети (с помощью или даже без помощи этой поисковой системы).

При обращении к поисковой системе по адресу google.com для украинских пользователей происходит переадресация на региональную версию google.com.ua. Если необходимо все-таки обратиться к «родной» поисковой системе, следует выбрать на стартовой странице ссылку Google.com in English. Разница между обоими поисковиками огромна — они различаются диапазоном просматриваемых при поиске адресов. Локализованные версии поисковиков (не только Google, но и других) «отдают предпочтение» локальным сайтам (а на самом деле часто только ими и ограничиваются). У многих поисковиков установлены ограничения на выход по ссылкам за пределы заданного сегмента.

Интерфейс поисковика подкупает своей лаконичностью (рис. 43) — на экране ничего лишнего, в т. ч. никакой рекламы. Достаточно ввести в строку запрос и нажать кнопку Поиск в Google. Под поисковой строкой можно уточнить, требуется ли выдавать страницы только на русском языке. Для перехода к украинскому интерфейсу внизу имеется ссылка Google.com.ua на українська — в этом случае под поисковой строкой будет предлагаться вариант поиска веб-страниц на украинском языке. Тем не менее, и при русскоязычном интерфейсе задание запроса украинским языком (если это очевидно из запроса) приведет к выдаче результатов на украинском языке (рис. 44).

Рис. 43. Поисковая система Google: русскоязычный и украиноязычный интерфейс

Рис. 44. Результат выполнения поискового запроса в Google

Google предлагает очень удобную работу с результатами. Под каждой ссылкой приведена пара строчек текста найденной страницы, в нем выделены жирным шрифтом искомые слова — это уже сразу дает некоторое представление о содержании страницы. Если за время, прошедшее со времени последней индексации, данная страница уже была перемещена, удалена или находится в нерабочем состоянии, можно запросить показать ее копию, сохраненную системой при прошлом просмотре сайта — для этого рядом с результатами имеются ссылки Сохранено в кэше. Страницу можно тут же перевести на другой язык с помощью ссылки Перевести эту страницу (см. рис. 44). Список языков с обеих сторон перевода довольно внушителен (рис. 45). Полученный результат полностью соответствует по оформлению оригиналу, а наведя мышь на любой фрагмент текста, получим всплывающий блок с текстом оригинала (рис. 46).

Наконец, если какой-либо результат весьма близок к желаемому, можно попытаться найти похожие на него страницы — для запуска такого (следующего) поиска имеются ссылки Похожие.

Рис. 45. Перевод найденной страницы

Рис. 46. Демонстрация параллельности перевода страницы

Однако если результаты не удовлетворяют пользователя, можно попробовать детализировать поиск, задав его более детально. Для этого рядом с поисковой строкой служит ссылка Расширенный поиск. В открывшемся окне (рис. 47) можно задать язык и регион, дату и формат файла, ограничить поиск каким-либо доменом и т. д.

Рис. 47. Окно расширенного поиска Google

Первые 4 поля имеют такие отличия. Если фразу «Хотинская крепость» ввести в строку со всеми словами, то будут найдены результаты, содержащие оба слова, хотя и не обязательно находящиеся рядом (например, в т. ч. и страницы о черновицкой крепости и хотинской битве). Тем не менее, система выведет в первых позициях результатов ссылки именно на те страницы, где слова соседствуют.

Чтобы потребовать поиск именно заданного словосочетания, его надо ввести в строку с точной фразой. Поле с любым из слов позволит запросить в том числе и результаты, где встречается только одно заданное слово (например, сайты о крепостях, но без упоминания о Хотине). Для запрета выдачи сайтов с такими словами введите их в поле без слов — например, иногда надо исключить из результатов поиска страницы со словами «купить», «продажа», «цена» и т. п.

Еще одна очень удобная возможность поисковика — поиск изображений. Для его вызова надо воспользоваться ссылкой Картинки в самом верху домашней страницы Google (см. рис. 43) и задать в строке ключевые слова поиска. В окне результатов будут выведены эскизы картинок, указаны размеры их файлов, разрешение и адреса сайтов, где они были найдены. Для просмотра изображения в полный размер достаточно щелкнуть по эскизу мышью и выбрать ссылку Просмотреть картинку полностью.

Чтобы повторить поиск, запросив файлы определенного формата, только большого или, наоборот, маленького размера, надо выбрать из выпадающих списков Размер и тип под строкой запроса нужные значения — поиск будет повторен.

Справедливости ради надо отметить, что поиск изображений еще не достиг большой результативности — обычно соответствующие запросу изображения собраны лишь на первых страницах результатов.

На англоязычной версии поисковика существует еще и возможность поиска видеофрагментов — найденные видеорезультаты поиска можно просмотреть тут же в окне (рис. 48). Также в англоязычной версии возможен поиск географического местопо­ложения объекта (карт) — система использует в своей работе превосходную программу Google Maps, позволяющую работать с ней в интерактивном режиме (рис. 49).

Рис. 48. Результат поиска видео на сайте Google

Из других иноязычных (точнее, англоязычных) поисковых систем надо назвать вторую по популярности поисковую службу Yahoo! (адрес yahoo.com) и принадлежащие этой компании поисковые машины AltaVista (av.com), Alltheweb (alltheweb.com).

Большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих поисковых роботов русскоязычными сайтами. Среди поисковых систем популярными являются Яндекс, Rambler, Mail.ru.

Рис. 49. Результат поиска карт на сайте Google

 

Система Яндекс (yandex.ru) предлагает для задания условий поиска еще один, отдельный интерфейс, не загруженный рекламой и иными ссылками, — ya.ru. Лаконичный дизайн (рис. 50), к сожалению, не позволяет вызвать опцию расширенного поиска или поиска картинок, однако это можно будет сделать на следующем шаге — получив первые результаты поиска (рис. 51).

Рис. 50.Окно поиска Яндекс

Рис. 51.Заголовок окна результатов поиска Яндекс

Щелчок по адресу сайта в окне результатов поиска открывает его просмотр в новом окне, что весьма удобно, поскольку результаты не теряются.

Так же как и Google, Яндекс предлагает посмотреть копию страницы, сохраненную у него на сервере (ссылка Сохраненная копия), однако перевода страниц или поиска схожих страниц не предлагает.

Поиск изображений вызывается по ссылке Картинки в верхней строке окна. Имеется возможность поиска видеоизображений — ссылка Видео (рис. 52). Кроме того, с использованием механизма Яндекс.Карты можно искать географическое местоположение объектов (рис. 53).

Рис. 52.Поиск видео на Яндекс

Рис. 53.Поиск на картах Яндекс

В целом, Яндекс оставляет очень позитивное впечатление от своей работы — по результативности, удобству, продуманности дизайна, насыщенной функциональности.

Еще одна русскоязычная поисковая система — Рамблер, традиционно любимая многими пользователями (rambler.ru — рис. 54). Она также имеет функции расширенного поиска, поиска картинок и видео (с функцией предпросмотра в окне эскиза) и др.

Рис. 54.Поисковая система Рамблер

Несмотря на украинскую принадлежность поисковой системы meta.ua (рис. 55), надо признать, что результаты ее работы не всегда удовлетворяют отечественного пользователя. Тем не менее, она также занимает одну из лидирующих позиций среди поисковых систем Уанета.

Рис. 55.Украинская поисковая система MЕТА

 

Рекомендации по поиску

Очевидно, что при каждом поиске хотелось бы добить­ся максимально возможных значений полноты и точности получения результатов. Для этого следует четко представлять цель поиска, правильно выбрать используемые средства поиска и правильно сформулировать поисковый запрос.

Прежде чем приступить к поиску, надо максимально конкретизировать поставленную задачу и выяснить основные требования к искомым документам. Запросы вида «прогноз погоды» свидетельствуют о неграмотном подходе к задаче, поскольку совершенно неясно, по какому региону требуется прогноз, на какой период и т. п.

Конечно, правильная формулировка поискового запроса тесно связана с используемыми поисковыми средствами, поскольку каждое из них может допускать различные параметры, опции и настройки поиска. Кроме того, один и тот же запрос может быть по-разному воспринят в разных поисковых системах. Например, по запросу, содержащему несколько слов, AltaVista ищет документы, содержащие все перечисленные слова, а EFind — документы, в которых содержится хотя бы одно из указанных слов.

Запрос должен быть составлен еще и так, чтобы ограничить количество найденных результатов. Ведь надо учитывать, что, скорее всего, пользователь просмотрит их не больше нескольких десятков, максимум — сотню. Следовательно, надо добиться (т. е. так сформулировать запрос), чтобы в списке результатов было соответствующее их количество. Данное условие можно использовать как некий «неформальный» критерий правильно организованного поиска. Можно дать некоторые рекомендации о формулировке запроса.

1. Очевидно, что основная цель — найти ответ на вопрос, а не задать его. Тем не менее, часто бывает, что часть ответа (или, быть может, даже весь ответ) известна еще до начала поиска. Скажем, требуется лишь подтверждение правильности ответа, или какие-либо подробности, или, наоборот, развернутое его изложение. В этом случае надо из известного ответа подобрать такие ключевые слова, понятия, которые должны содержаться именно в искомых документах, и только в них. Можно попытаться сочетать вопрос и ключевые слова ответа.

2. Не следует искать по одному слову, надо использовать хотя бы несколько ключевых терминов.

3. Обязательно следует проверять орфографию в запросе.

 

 

В том случае, если не удалось получить хороший результат с первой попытки (скорее всего, именно так и будет на первых порах освоения поисковых систем), надо проанализировать полученные результаты. Если выданных документов слишком много, следует организовать поиск внутри результатов первого поиска (так называемый итеративный поиск). Надо выяснить, чего именно недостает или излишне в запросе, чтобы конкретизировать его.

Например, запрос был сформулирован слишком общо и были выданы документы по другим темам. Чтобы исключить часть документов, где встречаются определенные слова на другую тематику, во втором запросе в большинстве поисковых систем надо указать эти слова и поставить перед ними знак минус.

Возможно, в одном из первых документов сразу будут видны дополнительные сведения об интересуемом предмете, — их сто́ит добавить их в запрос для его конкретизации.

Если документов найдено слишком мало или не найдено вовсе, можно попробовать задать синонимы ключевых слов или переформулировать запрос. Может, следует задать вопрос по более общей тематике, не столь конкретно.

Если среди найденных документов хотя бы один близок к требуемому результату, можно воспользоваться ссылкой в его описании Найти похожие документы (которая имеется у многих поисковых систем).

Если в будущем потребуется еще не раз искать информацию по данной теме или обновлять ее, лучше всего сохранять не список найденных результирующих документов, а сам запрос, который принес искомый результат (например, скопировав его в окно текстового редактора Блокнот и сохранив в файле).

Невзирая на изменения в документах (смене их адресов, удалении, появлении новых и т. д.), этот запрос снова выдаст релевантную (соответствующую) информацию.

 

 

Глава 4. Электронная почта

Настройка Почты Windows

Электронная почта (e-mail) сегодня стала способом повсе­дневного общения и все чаще и чаще заменяет почту обычную. Будучи одним из самых первых сервисов Интернета, она и сейчас затмевает популярностью многие другие виды службы Сети.

Для работы со стандартной электронной почтой, предоставляемой провайдерами (так называемой POP3-почтой), требуется специальная программа — почтовый клиент. Это установленная на компьютере пользователя программа, которая дает возможность получать, писать, отправлять и хранить электронные письма и вложенные в них файлы непосредственно на своем ПК, не заходя на почтовый сайт.

На сегодняшний день существует множество почтовых программ. Под эгидой Microsoft были разработаны программы, работающие в ОС Microsoft Windows: Почта Windows (по умолчанию установлена в Windows Vista); Microsoft Outlook Express (по умолчанию установлена в Windows XP); Outlook Office 2007 (входит в пакет программ Microsoft Office 2007); Outlook Office 2003 (входит в пакет программ Microsoft Office 2003).

Рассмотрим организацию работы с e-mail на примере программы Почта Windows, входящей в Windows Vista.

Для запуска программы надо выбрать в меню Пуск à Все программы команду Почта Windows (рис. 55).

Прежде всего программу предстоит настроить. Необходимо создать учетную запись, в которой указать адрес e-mail, пароль и служебные характеристики. Для создания учетной записи в окне программы надо выбрать в меню Сервис команду Учетные записи (рис. 56а). В открывшемся окне, нажав кнопку Добавить, следует выбрать в диалоговом окне (рис. 56б) тип добавляемой учетной записи (Учетная запись электронной почты) и нажать кнопку Далее.

 

В следующем окне следует ввести имя, которое будет отображаться в поле От кого всех отправляемых писем, и нажать кнопку Далее. В очередном окне указать почтовый адрес (рис. 57).

Теперь самая сложная часть работы — настройка приема и отправки почты. Для этого нужно ввести имена соответствующих серверов — POP3 и SMTP (описание назначения этих серверов см. выше, в разделе «Сервисы и службы Интернета» главы 2 «Основные ресурсы Интернета»).

Допустим, почтовый ящик был зарегистрирован на сервере mail.ru. Тогда адрес сервера входящих сообщений для приема почты — pop3.mail.ru; адрес сервера исходящих сообщений для отправки почты — smtp.mail.ru. Эти адреса можно получить у почтового провайдера, обслуживающего ваш почтовый ящик, либо, если ящик был создан на одном из бесплатных почтовых серверов Web, можно узнать из раздела справки на этих серверах. (Например, на почтовых серверах mail.ru, ukr.net ее можно вызвать по ссылке Помощь.) Как правило, адреса этих серверов идентичны: для сервера list.ru — pop3.list.ru и smtp.list.ru, для сервера bk.ru — pop3.bk.ru и smtp.bk.ru и т. д.

Рис. 55. Вызов почтовой программы Windows

а)

б)

Рис. 56. Добавление учетной записи:
а — выбор команды; б — начало настройки

Рис. 57. Указание почтового адреса

Рис. 58. Указание почтовых серверов

Следует отметить, что далеко не все почтовые серверы World Wide Web позволяют работать удаленно с их почтой. В первую очередь, программы — почтовые клиенты пред­на­зна­чены для работы с POP-серверами почтовых провайдеров.

Теперь можно войти в почтовый ящик и проверить его содержимое. Для этого следует в очередном диалоговом окне указать почтовый адрес и пароль (пароль будет в целях безопасности отображаться в виде точек). Если нет желания вводить эту информацию каждый раз при входе, можно установить флажок Запомнить пароль — рис. 59.

Рис. 59. Вход в почтовый ящик

Наконец, последний этап — определиться с местом хранения полученных писем. Программа предлагает перекачать все полученные письма пользователя, дожидающиеся его на почтовом сервере, на пользовательский ПК. Следует учитывать, что такая загрузка может занять достаточно времени, если письма содержат большие вложения, а часть из них совершенно незачем будет хранить на своем компьютере (возможно, среди них также окажется спам). Поэтому, если пользователь решит работать с почтовой корреспонденцией на почтовом сервере, он должен установить на конечном этапе опцию Не загружать сообщения электронной почты

По окончании этого процесса в списке учетных записей появится новая, только что созданная запись — рис. 60. Окно можно закрыть с помощью одноименной кнопки — настройка почты завершена.

Для изменения заполненных свойств учетной записи можно, нажав кнопку Свойства, заново пройти весь путь ее настройки. Для удаления учетной записи служит кнопка Удалить.

Рис. 60. Созданная учетная запись

 

 

Работа в Почте Windows

Общий вид окна программы Почта Windows представлен на рис. 61. Все сообщения почты (письма) распределяются по папкам. Список этих папок отображается в левой панели. Для работы с письмами заранее созданы 5 стандартных папок: Входящие — для полученных писем; Исходящие — для подготовленных к отправке писем; Отправленные — содержит копии отправленных писем; Удаленные — для удаленных писем; Черновики — для черновиков писем.

Рис. 61. Окно почтовой программы

Однако можно (и нужно) создать свои собственные папки и рассортировать по ним полученную корреспонденцию. Для этого служат команды меню Файл à Создать à Папка или Файл à Папка à Создать.

Содержимое той папки, которая выделена в левой панели, отображается в верхней части основного окна программы. В этом списке сообщений непрочтенные сообщения выделены жирным шрифтом. В списке отображаются адрес отправителя, тема письма и время отправки. В начале каж­дой строки имеется ряд значков — например, скрепка обо­зна­чает, что к письму прикреплены файлы, а значок от­крытого конверта — что это письмо уже было прочитано ранее.

Если выделить некоторое письмо в окне сообщений вверху, в нижней части окна программы будет выведено содержимое этого письма. Этого достаточно для чтения небольшого сообщения, но для удобства лучше вывести это письмо (сообщение) в отдельном окне (рис. 62), для чего следует дважды щелкнуть мышью на заголовке сообщения в верхней панели.

Рис. 62. Просмотр сообщения в отдельном окне

Если письмо помечено значком скрепки, значит, к письму приложены дополнительные файлы. Их можно просмотреть непосредственно в программе Почта Windows, а можно сохранить в выбранной папке на компьютере.

Прежде чем открывать полученные из Интернета файлы (в том числе и письма, а тем более вложения в них), их необходимо обязательно проверить на отсутствие вируса. Для этого следует воспользоваться имеющейся антивирусной программой. При этом в параметрах программы надо установить проверку файлов электронной почты. И только после этого можно работать с полученной почтой.

Чтобы открыть вложение непосредственно из письма, можно в основном окне программы дважды щелкнуть по значку скрепки в верхней части области просмотра писем. В контекстном меню этой же скрепки имеется команда Сохранить вложения, которая позволяет сохранить файл на компьютере.

 

Полученное письмо можно переслать другому адресату, воспользовавшись кнопкой Переслать — она присутствует и в основном окне программы, и в окне просмотра отдельного сообщения. Программа попросит указать адресата, которому будет перенаправлено письмо.

Для ответа на полученное сообщение в Почте Windowsимеются две команды — Ответить и Ответить всем (также и в основном окне программы, и в окне сообщения). Различия между ними проявляются только в том случае, если у письма было несколько адресатов. Первая команда предназначена для ответа непосредственно автору письма, вторая — автору и всем остальным получателям.

При выборе одной из команд будет открыто окно создания сообщения, в котором уже будет заполнено поле адреса, а в теме письма будет указана тема исходного, перед которой будет вставлена пометка Re: (сокращение от Reply — ответ). Дальнейшие действия пользователя такие же, как при написании нового сообщения.

Создание нового письма начинают с выбора в основном окне программы меню Файл à Создать à Почтовое сообщение или нажатия кнопки Создать почтовое сообщение. Будет открыто окно создания нового сообщения (рис. 63).

В окне надо заполнить адресные поля. Этих полей два: Кому и Копия. В первом из них обычно указывают основных получателей письма, в другом — второстепенных адресатов, от которых не требуется прямой реакции на сообщение, но которые должны быть в курсе событий (например, кроме директора предприятия, письмо будет отправлено в канцелярию). Можно, однако, перечислить все адреса в одном поле через точку с запятой.

Адрес электронной почты состоит из трех частей: имени (или идентификатора) пользователя, разделителя @ («коммерческое at», или «обезьянка», или «собачка») и адреса почтового сервера. Идентификатор может содержать только латинские буквы, цифры и знак подчеркивания (некоторые серверы допускают вместо подчеркивания дефис).