Сайт состоит из нескольких гипертекстов, связанных взаимными ссылками

Гиперссылка – это имена гипертекстов, расположенных на сайтах.

Для чтения гипертекстов используют специальные программы - браузеры.

Наиболее популярны:

  • NETSCAPE NAVIGATOR фирмы NETSCAPE.
  • INTERNET EXPLORER фирмы MICROSOFT.

Результат работы браузера – загрузка гипертекста по указанному адресу.

Если неизвестен адрес, то для поиска информации в Интернете используют:

  • Каталоги.
  • Поисковые системы.

Каталоги содержат:

  • Имена сайтов.
  • Имена серверов по отраслям.

Каталоги составляются редакторами, которые просматривают каждый новый сайт до его включения в каталог.

В процессе наполнения каталогов могут участвовать и разработчики сайтов при их регистрации в поисковых системах.

Интерфейс каталогов содержи список разделов, в котором отображены ссылки на URL – адреса наиболее важных документов. Каждая ссылка имеет аннотацию(краткое содержание документа).

В Российском секторе Интернета к крупнейшим каталогам относятся:

· WWW.RU – основной каталог российских сайтов.

· LIST.RU - электронный каталог российских сайтов.

· STAR.RU – электронный каталог лучших сайтов.

Каталоги позволяют найти сайты и зарегистрировать новые сайты и сервера.

 

Поисковые серверы Интернета делят на 2 группы:

  • Поисковые системы общего назначения.
  • Поисковые системы специального назначения.

Поисковые системы общего назначения позволяют найти документы в WWW по ключевым словам и/или с помощью иерархической системы каталогов.

Поисковые системы специального назначения позволяют искать информацию в виде файлов в архивах и системе поиска адресов электронной почты. Это Российская файловая поисковая система (WWW..files.ru) и {WWW.Filesearch.ru}.

БД поисковых систем заполняются роботизированными системами. Специальные программы – роботы (“пауки”) постоянно обходят Интернет в поисках новой информации, которую они вносят в БД.

БД в Интернете содержат URL – адреса и информацию, связанную с этими адресами.

Мощные “пауки” обходят Интернет за несколько дней.

Показателями качества поискового сервера являются:

  • Объем БД (количество документов).
  • Скорость обхода Интернета ”поуком” (скорость обновления информации в Интернете).
  • Возможность расширения поиска с использованием языка запросов.
  • Разной структурой системы каталогов.
  YANDEX RAMBLER APORT
ОБЪЕМ БД на начало 2001г Более 31 млн. документов Более12 млн. документов Более 14 млн. документов
Каталоги 17 разделов 56 разделов 14 разделов
Язык запросов И(пробел, &) ИЛИ(|) И(AND, пробел, &) ИЛИ(|, OR) И(AND, пробел) ИЛИ, OR)

Наиболее используемые русские поисковые системы:

  • YANDEX.RU – наиболее удобная система.
  • RAMBLER.RU – наиболее популярная система.
  • APORT.RU – наиболее простая система.

Международные поисковые системы, которые имеют каталоги на русском языке:

  • LYCOS. RU – европейская система поиска(Лайкос).
  • GOOGLE.RU – международная система поиска.

Международные поисковые системы, которые позволяют делать запросы на русском, английском, испанском, французском и немецком языке:

  • ALTAVISTA
  • INFOSEEK
  • YAHOO

В окне поисковой системы задаются ключевые слова.

Результат работы поисковой системы – перечень ссылок на гипертексты и сайты с их названием и краткой аннотацией.

Процесс загрузки WEB – страницы:

  • Заданное пользователем доменное имя сервера ищется в инрархической БД доменной системы имен (DOMAIN NAM SYSTEM -DNS), которая хранится на DNS – серверах.
  • Если в БД DNS имя сервера найдено, то начинается поиск самого сервера и ожидается отклик от него.
  • Если сервер найден, то производится соединение с сервером по IP – адресу (цифровому).
  • Загружается WEB – страница и связанные с ней мультимедийные объекты (графические и звуковые файлы).

Если WEB – страница расположена на локальном компьютере, то в поле ”Адрес” вводят полной путь к файлу.

Кроме того, WEB – страницу можно загрузить командой ”Файл - Открыть”.

Установка правильной кодировки WEB – страницы:

WEB – страница – это текстовый файл с тэгами HTML, поэтому при просмотре русскоязычных страниц возникают проблемы с кодировкой, которые надо уметь менять.

Браузеры могут отображать информацию в любой кодировке.

Существует 6 различных кодировок:

  • CP – 866 (MS - DOS).
  • CP- 1251 (Windows).
  • KOI8-R (UNIX).
  • MAC (MAC OS)
  • ISO
  • UNICODE

ПРОТОКОЛЫ СЕТИ ИНТЕРНЕТ

Протокол Интернета TPC/IP:

· TCP (Transmission Control Protocol)

· IP (Internet Protocol)

Правила передачи информации в Интернете называют IP – INTERNET PROTOCOL (Протокол Интернета).

IP протокол работает так:

· Данные помещаются в специальный конверт (пакет), к нему добавляется цифровой адрес ПК, которому предназначена информация.

· Пакет отправляется в ближайший к отправителю маршрутизатор, который решает, куда отправить пакет.

Протокол управления передачей информации в Интернете называют TCP – Transmission Control Protocol.

TCP протокол работает так:

· Большие объемы разбивают на порции, каждая порция идет своим путем.

· Иногда часть данных теряется, и их отправляют повторно.

· Получатель собирает все пакеты и получает нужную информацию. Т.к. в Интернете оба протокола используют вместе, то принято говорить, что работает протокол TPC/IP.

ВЫВОД: Разбивка на пакеты повышает надежность передачи, но из – за возвратов уменьшается скорость доставки пакетов.

Билет №4