Набор соглашений о правилах формирования и форматах сообщений называется протоколом

Далее ⇒

Фундаментальной чертой цивилизации является рост производства, потребления и накопления информации во всех отраслях человеческой деятельности. Вся жизнь человека, так или иначе, связана получением, накоплением и обработкой информации. Что бы человек ни делал: читает ли он книгу, смотрит ли он телевизор, разговаривает, он постоянно и непрерывно получает и обрабатывает информацию.

В области накопления научной информации существует тенденция увеличения количества данных в геометрической прогрессии – так объем знаний, начиная с XVII в., удваивался примерно каждые 10 - 15 лет. Поэтому одной из важнейших проблем человечества является лавинообразный поток информации в любой отрасли его жизнедеятельности. Подсчитано, например, что в настоящее время специалист должен тратить около 80% своего рабочего времени, чтобы уследить за всеми новыми печатными работами в его области деятельности. Увеличение информации и растущий спрос на неё обусловили появление отрасли, связанной с автоматизацией обработки информации – информатики. Но для перехода непосредственно к науке информатике, необходимо сказать о самой информации.

Несмотря на то, что с понятием информации мы сталкиваемся ежедневно, строго и общепринятого её определения до сих пор не существует, поэтому вместо определения обычно используют понятие об информации. Понятие об информации, введённое в рамках одной научной дисциплины, может опровергаться конкретными примерами и фактами, полученными в рамках другой дисциплины.

Понятие информации не может основываться на таких понятиях, как - истинное знание, и не может опираться только на объективность фактов и свидетельств. Средства вычислительной техники обладают способностью обрабатывать информацию автоматически, без участия человека. Эти средства могут работать с искусственной, абстрактной и даже с ложной информацией, не имеющей объективного отражения ни в природе, ни в обществе. Итак, информация – продукт взаимодействия данных и адекватных им методов.

Другой подход рассматривает информацию как свойство материи. При этом утверждается, что информацию содержат любые сообщения, воспринимаемые человеком или приборами. Информация не может существовать вне материи, а значит, она существовала и будет существовать вечно – ее можно накапливать, хранить перерабатывать.

Рассмотрим несколько наиболее распространенных определений информации.

Информация – набор символов, графических сигналов, несущих определенную смысловую нагрузку.

Информация – отображение реального мира с помощью сведений (сообщений).

Информация – сведения о чем-либо или о ком-либо, представленные в виде знаков и символов.

Информация – продукт взаимодействия данных и методов.

Анализируя информацию, мы сталкиваемся с необходимостью оценки качества и определения количества получения информации. Определить качество информации чрезвычайно сложно, а часто и вообще невозможно. Какие-либо сведения, например исторические, десятилетиями считаются ненужными, и вдруг их ценность может резко возрасти. Вместе с этим определить количество информации не только нужно, но и можно. Это прежде всего необходимо для того, чтобы сравнить друг с другом массивы информации, определить, какие размеры должны иметь материальные объекты (бумага, магнитная лента и т. д.), хранящие эту информацию.

Для определения количества информации нужно найти способ представить любую ее форму (символьную, текстовую, графическую) в едином виде. Иначе говоря, надо суметь эти формы информации преобразовать так, чтобы она получила единый стандартный вид. Таким видом стала так называемая двоичная форма представления информации — запись любой информации в виде последовательности только двух символов.

Эти символы могут на бумаге обозначаться любым способом: буквами А, Б; словами ДА, НЕТ. Однако ради простоты записи взяты цифры 1 и 0. В электронном аппарате, хранящем либо обрабатывающем информацию, рассматриваемые символы могут также обозначаться по-разному: один из них — наличием в рассматриваемой точке электрического тока либо магнитного поля, второй — отсутствием в этой точке электрического тока либо магнитного поля.

Методику представления информации в двоичной форме можно пояснить, проведя следующую игру. Нужно у собеседника получить интересующую нас информацию, задавая любые вопросы, но получая в ответ только одно из двух: ДА либо НЕТ.

Известным способом получения во время этого диалога двоичной формы информации является перечисление всех возможных событий.

Рассмотрим простейший пример получения информации. Вы задаете только один вопрос: «Идет ли дождь?». При этом условимся, что с одинаковой вероятностью ожидаете ответ «ДА» или «НЕТ». Легко увидеть, что любой из этих ответов несет самую малую порцию информации. Эта порция определяет единицу измерения информации, называемую битом. Благодаря введению понятия единицы информации появилась возможность определения размера любой информации числом битов. Образно говоря, если, например, объем грунта определяют в кубометрах, то объем информации — в битах.

Условимся каждый положительный ответ представлять цифрой 1, а отрицательный — цифрой 0. Тогда запись всех ответов образует многозначную последовательность цифр, состоящую из нулей и единиц, например 0100.

Рассмотренный процесс получения двоичной информации об объектах исследования называют кодированием информации. Кодирование информации перечислением всех возможных событий очень трудоемко. Поэтому на практике кодирование осуществляется более простым способом. Он основан на том, что один разряд последовательности двоичных цифр имеет уже вдвое больше различных значений (00, 01, 10, 11), чем одноразрядная последовательность (0 и 1). Трехразрядная последовательность имеет также вдвое больше значений (000, 001, 010,011, 100, 101, 110, 111), чем двухразрядная, и т. д. Добавление одного разряда увеличивает число значений вдвое. Вообще говоря, п-разрядная последовательность имеет 2" значений.

Пользуясь этим, легко закодировать любое множество событий. Например, нам нужно закодировать 32 буквы русского алфавита, для этой цели достаточно взять пять разрядов, потому что пятиразрядная последовательность имеет 32 различных значения.

В информационных документах широко используются не только русские, но и латинские буквы, цифры, математические знаки и другие специальные знаки, всего примерно 200— 250 символов. Поэтому для кодировки всех указанных символов используется восьмиразрядная последовательность цифр 0 и 1. Например, русские буквы представляются восьмиразрядными последовательностями следующим образом: А — 11000001, И - 1100101, Я - 11011101.

Следует отметить, что указанный способ кодирования используется тогда, когда к нему не предъявляются дополнительные требования: допустим, необходимо указать на возникшую ошибку, исправление ошибки, обеспечить секретность информации. В этих случаях применяют специальное кодирование, при использовании которого коды получаются длиннее, чем в указанном способе.

Для представления графической информации в двоичной форме используется так называемый поточечный способ. На первом этапе вертикальными и горизонтальными линиями делят изображение. Чем больше при этом получилось квадратов, тем точнее будет передана информация о картинке. Как известно из физики, любой цвет может быть представлен в виде суммы различной яркости зеленого, синего и красного цветов. Поэтому информация о каждой клетке будет иметь довольно сложный вид: номер клетки — 101 10010, 01111010, яркость зеленого — 1010, яркость синего — 1101, яркость красного - ООП.

Перед тем как кодировать любую информацию, нужно договориться о том, какие используются коды, в каком порядке они записываются, хранятся и передаются. Это называется языком представления информации.

Из примеров, рассмотренных выше, видно, что информация описывается многоразрядными последовательностями двоичных чисел. Поэтому для удобства эти последовательности объединяются в группы по 8 бит. Такая группа именуется байтом, например, число 11010011 — это информация величиной в один байт.

В своей деятельности человек использует все большие массивы информации. Так, если с 1940 по 1950 год объем информации удвоился примерно за 10 лет, то в настоящее время это удвоение уже происходит за 2—3 года. При работе с информацией приходится решать большо'.1 число вопросов, связанных с удобными и выгодными формами ее хранения, передачи, поиска, обработки. Кроме этого, возникают задачи, связанные с определением структуры информации. Необходимо также изучать общие свойства информации. Всем этим занимается наука информатика.

Для того чтобы использовать автомобильный транспорт, людям пришлось договориться о всеобщих правилах, которым он должен подчиняться. Точно так же сеть Интернет не может существовать без единых правил, определяющих порядок передачи данных компьютерами в сети, так как компьютеры строятся на различных аппаратных платформах и управляются различными операционными системами.

Набор соглашений о правилах формирования и форматах сообщений называется протоколом.

Передаваемые данные разбиваются на небольшие порции, называемые пакетами. Каждый пакет перемещается в сети, независимо от других пакетов. Они переходят с одного узла на другой и далее пересылаются на другой узел, находящийся "ближе" к адресату. Если пакет передан неудачно, передача повторяется. Теоретически возможно, что разные сообщения пройдут разными путями, но все равно достигнут адресата и будут собраны в полный документ. Возможно, что некоторые документы, отправленные из Англии в Австралию, обогнут земной шар с востока на запад, а другие - с запада на восток.

Сети в Интернете все связываются друг с другом, потому что все компьютеры, участвующие в передаче данных, используют единый протокол коммуникации TCP / IP(читается «ти-си-пи / ай-пи”).

На самом деле протокол TCP / IP – это два разных протокола, определяющие различные аспекты передачи данных в сети:

Протокол TCP (Transmission Control Protocol)– протокол управления передачей данных, использующий автоматическую повторную передачу пакетов, содержащих ошибки; этот протокол отвечает за разбиение передаваемой информации на пакеты и правильное восстановление информации из пакетов получателя.

Протокол IP (Internet Protocol) – протокол межсетевого взаимодействия, отвечающий за адресацию и позволяющий пакету на пути к конечному пункту назначения проходить по нескольким сетям.

Схема передачи информации по протоколу TCP / IPтакова:

протокол TCP разбивает информацию на пакеты и нумерует все пакеты;
далее с помощью протокола IP все пакеты передаются получателю, где с помощью протокола TCP проверяется, все ли пакеты получены;
после получения всех пакетов протокол TCP располагает их в нужном порядке и собирает в единое целое.

Для работы прикладных программ, таких как программы электронной почты, требуется не только правильно упаковать информацию в пакеты и отправить их, но и необходимо четко договориться о содержимом этих пакетов, а также о процедуре обмена пакетами. Так, например, для получения письма необходимо предъявить пароль обладателя почтового ящика, а это уже целая последовательность действий. Таким образом, необходимы и другие протоколы.

Название протокола	Расшифровка	Назначение
HTTP	Hyper Text Transfer Protocol	Протокол передачи гипертекста
FTP	File Transfer Protocol	Протокол передачи файлов
SMTP	Simple Mail Transfer Protocol	Простой протокол отправки электронных писем
POP3	Post Office Protocol 3	Протокол получения электронных писем
NNTP	News Net Transfer Protocol	Протокол телеконференций

Протокол передачи данных — набор соглашений интерфейса логического уровня, которые определяют обмен данными между различными программами. Эти соглашения задают единообразный способ передачи сообщений и обработки ошибок при взаимодействии программного обеспечения разнесённой в пространстве аппаратуры, соединённой тем или иным интерфейсом.

Стандартизированный протокол передачи данных также позволяет разрабатывать интерфейсы (уже на физическом уровне), не привязанные к конкретной аппаратной платформе и производителю (например, USB, Bluetooth).

Сетевой протокол — набор правил и действий (очерёдности действий), позволяющий осуществлять соединение и обмен данными между двумя и более включёнными в сеть устройствами.

Разные протоколы зачастую описывают лишь разные стороны одного типа связи. Названия «протокол» и «стек протоколов» также указывают на программное обеспечение, которым реализуется протокол.

Новые протоколы для Интернета определяются IETF, а прочие протоколы — IEEE или ISO. ITU-T занимается телекоммуникационными протоколами и форматами.

Наиболее распространённой системой классификации сетевых протоколов является так называемая модель OSI, в соответствии с которой протоколы делятся на 7 уровней по своему назначению — от физического (формирование и распознавание электрических или других сигналов) до прикладного (интерфейс программирования приложений для передачи информации приложениями).

Сетевые протоколы предписывают правила работы компьютерам, которые подключены к сети. Они строятся по многоуровневому принципу. Протокол некоторого уровня определяет одно из технических правил связи. В настоящее время для сетевых протоколов используется модель OSI (Open System Interconnection — взаимодействие открытых систем, ВОС).

Модель OSI — это 7-уровневая логическая модель работы сети. Модель OSI реализуется группой протоколов и правил связи, организованных в несколько уровней:

· на физическом уровне определяются физические (механические, электрические, оптические) характеристики линий связи;

· на канальном уровне определяются правила использования физического уровня узлами сети;

· сетевой уровень отвечает за адресацию и доставку сообщений;

· транспортный уровень контролирует очередность прохождения компонентов сообщения;

· задача сеансового уровня — координация связи между двумя прикладными программами, работающими на разных рабочих станциях;

· уровень представления служит для преобразования данных из внутреннего формата компьютера в формат передачи;

· прикладной уровень является пограничным между прикладной программой и другими уровнями — обеспечивает удобный интерфейс связи сетевых программ пользователя.

· Примеры сетевых протоколов

TCP/IP — набор протоколов передачи данных, получивший название от двух принадлежащих ему протоколов: TCP (англ. Transmission Control Protocol) и IP (англ. Internet Protocol)^[1]

Наиболее известные протоколы, используемые в сети Интернет:

· HTTP (Hyper Text Transfer Protocol) — это протокол передачи гипертекста. Протокол HTTP используется при пересылке Web-страниц с одного компьютера на другой.

· FTP (File Transfer Protocol) — это протокол передачи файлов со специального файлового сервера на компьютер пользователя. FTP дает возможность абоненту обмениваться двоичными и текстовыми файлами с любым компьютером сети. Установив связь с удаленным компьютером, пользователь может скопировать файл с удаленного компьютера на свой или скопировать файл со своего компьютера на удаленный.

· POP (Post Office Protocol) — это стандартный протокол почтового соединения. Серверы POP обрабатывают входящую почту, а протокол POP предназначен для обработки запросов на получение почты от клиентских почтовых программ.

· SMTP (Simple Mail Transfer Protocol) — протокол, который задает набор правил для передачи почты. Сервер SMTP возвращает либо подтверждение о приеме, либо сообщение об ошибке, либо запрашивает дополнительную информацию.

· telnet — это протокол удаленного доступа. TELNET дает возможность абоненту работать на любой ЭВМ сети Интернет, как на своей собственной, то есть запускать программы, менять режим работы и так далее. На практике возможности лимитируются тем уровнем доступа, который задан администратором удаленной машины.

Другие протоколы:

· DTN — протокол, предназначенный для обеспечения сверхдальней космической связи.

Список сетевых протоколов

Канальный уровень

· Ethernet

· Token ring

· FDDI

· HDLC

· GVRP

· PPP, PPTP, L2TP

· ATM

· xDSL

Сетевой уровень

· ICMP

· IPv4, IPv6

· IPX

· ARP

Транспортный уровень

· SPX

· XOT

· ISODE

· DVMRP

· TCP

· UDP (Unreliable/User Datagram Protocol)

· SCTP

· RDP/RUDP (Reliable Data Protocol/Reliable User Datagram Protocol)

· RTCP

Сеансовый уровень

· SSL

· NetBIOS

Прикладной уровень

· HTTP

· HTTPS

· IMAP

· IRC

· XMPP

· NTP

· NNTP

· POP3

· Telnet

Поиск информации в Интернете может быть произведен по нескольким методам, значительно различающимся как по эффективности и качеству поиска, так и по типу извлекаемой информации.

В ряде случаев приходится использовать весьма трудоемкие методы - результат того стоит.

Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.

В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы.

Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы. Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:

Далее ⇒