Рекомендации по поиску информации в Интернете
Информационный запрос – входное сообщение в автоматизированную систему, содержащее требование на выдачу информации. В поисковых системах запрос представляет собой набор слов и служебных символов, характеризующий искомую информацию.
Ниже приводятся советы по поиску сайтов и документов.
1. Следует использовать поисковые системы, если:
• тема сформулирована достаточно узко;
• требуется найти конкретные документы с указанными словами;
• необходим поиск в новостях, текстах СМИ, в том числе по региональным, местным источникам;
• исследователь имеет достаточную квалификацию в информационном поиске, умеет применять технологии сложных запросов (форму расширенного поиска, правила и операторы языка запросов), использовать справку поискового сайта.
2. Следует использовать каталоги и тематические порталы, если:
• тема сформулирована широко и желательно получить представление о ее структуре и категориях;
• необходимы ссылки, отобранные и аннотированные специалистами;
• предпочтение отдается качеству над количеством;
• разыскивается информация в базах данных и зависящая от условий обращения, в том числе по конкретной стране.
3. Следует пользоваться метапоисковыми системами, если документов мало.
4. Следует привлекать научный и практический опыт, советы и наблюдения отечественных и зарубежных специалистов, проводя поиск в материалах сайтов социальных сетей, Твиттере, блогах.
5. Число ссылок в результатах поиска можно сократить, если составлять запрос больше чем по одному слову, использовать уточняющие слова, избегать неконкретно сформулированных запросов, переходить к форме расширенного поиска (с указанием параметров) или к языку запросов (с операторами в поисковой фразе, составленной но справке к поисковой системе).
Название со словом сайт помогает найти сайт организации, учреждения, фирмы, журнала, газеты. Но короткий запрос с названием организации, например "МГУ", оставляет неясность, что именно ищут про объект: просто информацию, условия поступления, список факультетов или журналы вуза. Чем реже употребляется в языке слово, по которому запрошен поиск, тем скорее найдется документ.
6. Если в списке результатов есть документ, который можно расценить как наиболее подходящий, следует использовать к нему ссылку Найти похожие документы.
Поиск изображений в Интернете
В компьютерных информационных технологиях имидж (англ, image – образ, изображение, впечатление) – любой рисунок, фотография, картина и т.п. Никогда ранее в истории человечества не было так много изображений, к которым можно получить доступ в одном месте и сразу. Системы поиска изображений в Интернете совершенствуются, но найти изображение труднее, чем текст. Особенность в том, что образ – не слово, не набор букв, а для поиска требуется все-таки словесное описание.
Как выполнить поиск картины периода Ренессанса с женщиной, держащей младенца: Сикстинская Мадонна, Дева Мария, мать, женщина с ребенком? Запрос на ключевое слово "оранжевый" расценивается как плод и цвет. И при размещении рисунка на своей веб-странице, и при поиске его с помощью поисковой системы следует понимать, как поисковые системы формируют базы данных рисунков. Поскольку программа не может "рассмотреть" рисунок, она "читает" и индексирует соответствующий рисунку текст: подписи и ссылки к картинкам; часть текста документа, обрамляющего картинку; имена файлов рисунков, в том числе с учетом транслитерации и упрощенного перевода.
Цифровые изображения на веб-страницах выполняются в файлах разных форматов, которые обозначаются расширением имени файла GIF, JPG, PNG и др. Поиск изображения в поисковой системе по размеру ведут не по размеру файла, а размеру в пикселях. Рисунки до 1000 и даже до 10 000 квадратных пикселей считаются мелкими, малыми; до 100 000 (300x300) – средними, а до 1 000 000 и выше – большими. Поисковые системы нс включают баннеры в списки графики.
Поисковые системы Яндекс, Google, Bing и другие выполняют поиск файлов с рисунками в рубриках Картинки, Рисунки, Images. По запросу предоставляются уменьшенные копии изображений – миниатюры. Имя файла рисунка может не соответствовать изображению, поэтому, просмотрев миниатюры, переходят по ссылке к рисунку в исходном размере и его странице, читают контекст. Расширенный поиск рисунков можно выполнить, заполнив условия в форме: искать только рисунок, учитывать размер, подпись, описание в окружающем тексте.
Веб-ресурсы содержат миллиарды изображений разных размеров, форматов, тем, способов создания. Для профессиональных и личных целей можно искать иллюстрации, фотографии, научные рисунки, графику, картины. Изображение произведения искусства на веб-странице может отличаться от оригинала цветом (зависит от средств подготовки страницы, настройки монитора), кадрированием (вырезан фрагмент, применен коллаж, монтаж, объединено несколько картин).
Особая деятельность поисковых систем. Поисковые системы вносят в базы данных оказавшиеся доступными страницы, в том числе и те, которые им удалось найти из-за неосторожности или программных ошибок администратора сервера, сайта. Новые возможности возникли с появлением современных продвинутых поисковых систем. Организации, применяющие электронный документооборот, часто размещают на серверах файлы для внутреннего пользования, скрытые. Поисковые программы ведут поиск не только веб-страниц, по и связанных с ними ссылками файлов документов форматов RTF, Word, Excel, PowerPoint, Works, Write, Adobe PostScript. Язык запросов поисковой системы Google позволяет проникать на серверы глубже веб-содержания и даже находить скрытые документы, преодолевая не очень сложные средства защиты от постороннего доступа. В результате такого "углубленного" поиска поисковая система сохраняет копии документов внутреннего назначения (того, что не получить при прямом посещении сайта) и предоставляет их просмотр из своей базы данных. Поэтому, когда не приняты дополнительные меры защиты, на сервер, к которому есть доступ из Интернета, не следует выносить документы, не предназначенные для посторонних.
Статистика запросов, поступающих в поисковые системы, – полезный источник анализа тем и интересов общества в сочетании с классификацией отправителей запросов по территориальным IP-адресам, провайдерам, организациям.