Вопрос45.Универсальная форма адресации информационных ресурсов.

URI (Uniform Resource Identifier, Универсальный идентификатор ресурса) (RFC 2396, August 1998) - компактная строка символов для идентификации абстракного или физического ресурса. Под ресурсом понимается любой объект, принадлежащий некоторому пространству. Включает и переопределяет определенные ранее URL (RFC 1738/RFC 1808) и URN (RFC 2141, RFC 2611).

 

URI предназначен для уникальной идентификации любого ресурса.

 

Некоторые подмножества URI:

 

URL (Uniform Resource Locator, Универсальный указатель ресурса), - подмножество схем URI, который идентифицирует ресурс по способу доступа к нему (например, его "местонахождению в сети") вместо того, чтобы идентифицировать его по названию или другим атрибутам этого ресурса.

 

IP-адрес или соответствующее ему доменное имя позволяют однозначно идентифицировать компьютер в сети Internet, но дело в том, что на компьютере может присутствовать множество различной информации в различных форматах, например, в виде файлов, электронных сообщений, страниц и т.п. Для того, чтобы можно было безошибочно получать нужную информацию и в нужном формате используется строка символов, которую называют универсальный указатель ресурса или URL (Universal Resource Locator). Эта строка однозначно идентифицирует любой ресурс в сети Internet. Именно такая строка отображается в поле «Адрес» обозревателя Internet Explorer, когда мы «гуляем» по Internet (см. далее).

 

 

Рис. 1.7. Структура URL - универсального указателя ресурса.

 

Универсальный указатель ресурса состоит из:

Протокол – это набор правил (см. далее), по которым происходит обмен информацией. В данном примере использован наиболее часто используемый протокол http:// – протокол передачи гипертекста.

Доменное имя или IP-адрес, который позволяет однозначно идентифицировать компьютер (сервер) в сети Internet, содержащий нужную информацию.

Путь, состоящий из имен папок, разделенных символом / (слэш), последовательно открывая которые можно «добраться» до нужной информации. В данном примере искомая информация находится в папке info, в других случаях путь может быть длиннее, например, products/mpress/library, здесь искомая информация находится в папке library, находящейся в папке mpress, которая в свою очередь располагается внутри папки products.

Примечание: многие серверы сети Internet в отличие от компьютеров пользователей чувствительны к регистру букв, в котором представлены имена папок и файлов, поэтому папка info и папка Info или INFO – это разные папки, но чаще всего имена файлов и папок пишут строчными (маленькими) буквами.

Имя файла, который содержит нужную информацию. В нашем примере информация находится в файле search.html, в котором содержатся советы по поиску на поисковом сервере yandex.ru.

 

Примечание: если имя файла не указано, то используется имя файла по умолчаниюindex.htm (index.html), либо default.htm (default.html).

 

Поскольку весь URL набирать с клавиатуры достаточно долго и неудобно, то можно вводить только доменное имя (www в некоторых случаях также можно опускать), а все остальные его части, такие как протокол, путь и имя файла будут подставлены по умолчанию.

 

Общепринятые схемы (протоколы) URL включают:

 

ftp — Протокол передачи файлов FTP

 

http — Протокол передачи гипертекста HTTP

 

https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)

 

gopher — Протокол Gopher

 

mailto — Адрес электронной почты

 

news — Новости Usenet

 

nntp — Новости Usenet через протокол NNTP

 

irc — Протокол IRC

 

prospero — Служба каталогов Prospero Directory Service

 

telnet — Ссылка на интерактивную сессию Telnet

 

wais — База данных системы WAIS

 

xmpp — Протокол XMPP (часть Jabber)

 

file — Имя локального файла

 

data — Непосредственные данные (Data: URL)