Соболь Б.В., Галин А.Б., Панов Ю.В., Рашидова Е.В., Садовой Н.Н.

12
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Далее ⇒

Б.В. Соболь А.Б. Галин Ю.В. Панов Е.В. Рашидова Н.Н. Садовой

Информатика

Учебник

Ростов-на-Дону

«Феникс»

УДК 004(075.8) ББК 32.81я73. С 54

Рецензенты:

кафедра «Информационные системы в строительстве» РГСУ, доктор технических наук, профессор РГУ А.В. Аграновский

Соболь Б.В., Галин А.Б., Панов Ю.В., Рашидова Е.В., Садовой Н.Н.

С 54 Информатика:Учебник. — Ростов н/Д: Феникс, 2005. — 448 с. (Высшее образование).

В учебнике представлены все разделы информатики, определяющие современный уровень подготовки специалистов в системе высшего образования. По своему содержанию книга полностью соответствует требованиям государственных образовательных стандартов для широкого спектра специальностей высших учебных заведений.

Адресовал преподавателям и студентам высших учебных заведений, слушателям институтов повышения квалификации, пользователям, а также широкому кругу читателей.

I5ВN 5-222-05934-0 ББК 32.81я73

УДК 004(075.8)

© Соболь Б.В., Галин А.Б., Панов Ю.В.,

Рашидова Е.В., Садовой Н.Н., 2005

© Оформление, изд-во «Феникс», 2005

предисловие

Широкое использование информационных технологий во всех сферах человеческой деятельности является одним из основных признаков цивилизованного общества. Мировая история не знает никакой другой отрасли науки и технологий, развивающихся столь стремительными темпами. Трудно представить себе современного специалиста, не владеющего основными навыками работы с компьютером.

Эти процессы находят свое отражение и в системе высшего образования. В 90-е годы в нашей стране появился и интенсивно развивается широкий спектр специальностей, связанных с информационными технологиями. Вместе с этим, информатика заняла свое достойное место среди базовых дисциплин и стала неотъемлемой компонентой учебных планов всех без исключения специальностей высших учебных заведений. Уникальность этой науки обусловлена и еще одним очень важным обстоятельством. В настоящее время информационные технологии проникли практически во все общенаучные и специальные дисциплины, стали привычным инструментарием как в учебной, научной, так и в практической деятельности.

По замыслу авторов, новый учебник по информатике, во-первых, по содержанию и форме изложения является актуальным. Авторы не стремятся к детальному и исчерпывающему изложению технических характеристик и возможностей всех аппаратных средств и программных продуктов. Вместе с тем, в книге отражены не только все основные принципы и положения информатики как науки, но и современные аспекты и тенденции развития информационных технологий. Во-вторых, содержание книги соответствует основным положениям государственных образовательных стандартов по информатике. Это позволяет использовать ее в качестве основного учебника по этой дисциплине студентам подавляющего большинства специальностей, за исключением тех, кто специализируется, в этой области. В-третьих, что не менее важно, новый учебник по информатике, в отличие от многих своих собратьев, является компактным. Авторы уверены, что последнее обстоятельство создаст дополнительные удобства для студентов и преподавателей, пользующихся этой книгой.

Содержание учебника - это, в основном, теоретический материал по всем разделам изучаемой дисциплины, или несколько расширенный вариант лекционного курса по информатике для студентов всех специальностей (за исключением профилирующих) Донского государственного технического университета. Отдельным изданием в ближайшее время выйдет «Практикум по информатике», основой которого является комплекс лабораторных и практических занятий, сопровождающих учебный курс.

Мы надеемся, что новая книга по информатике не только поможет вам лучше понять, успешно освоить эту науку, но и полюбить ее, сделать неотъемлемой частью жизни и профессиональной деятельности.

Авторы

Список сокращений

АВМ — аналоговая вычислительная машина

АЛУ — арифметико-логическое устройство

АО — аппаратное обеспечение

АПС — аппаратно-программные средства

АЦП — аналогово-цифровой преобразователь

БД — база данных

БИС — большая интегральная схема

ВЗУ — внешнее запоминающее устройство

ГВС — глобальные вычислительные сети

ДНФ - дизъюнктивная нормальная форма

ЖКИ — жидкокристаллические индикаторы

ИС — информационная система

КНФ — конъюнктивная нормальная форма

КС — компьютерная система

ЛВС — локальные вычислительные сети

НСД — несанкционированный доступ

ОЗУ — оперативное запоминающее устройство

ООП — объектно-ориентированное проектирование

ОС - операционная система

ПЗУ — постоянное запоминающее устройство

ПО — программное обеспечение

ППЗУ — перепрограммируемые ПЗУ

ППО - прикладное программное обеспечение

ППП — пакет прикладных программ

РОН — регистры общего назначения

СА — сетевой адаптер

САУ — система автоматического управления

СБИС - сверхбольшая интегральная схема

СВТ — средства вычислительной техники

СУБД — система управления базой данных

ФС — файловая система,

ФСА - функциональная структура алгоритма

ЦАП - цифро-аналоговый преобразователь

ЦВМ - цифровая вычислительная машина

ЦП - центральный процессор

ЭВМ — электронная вычислительная машина

ЭЛТ — электронно-лучевая трубка

АСР (Accelerated Graphics Port) — локальная шина видеоконтроллера

CASE (Computer Aided Software Engineering) - программно-технологические средства специального класса

CD (Compact Disk) — оптический компакт-диск

CD-R (CD-Recodable) — оптический компакт-диск с однократной записью

CD-RW (CD-ReWritable) — оптический компакт-диск с многократной записью

CISC (Соmр1ех Instruction Set Computer) — полная система команд переменной длины

CMYK — модель представления светоотражающих графических

объектов

DDE (Dynamic Data Exchange) — динамический обмен данных

DDoS (Distributed DoS) — DoS атака, проводимая в определенное время

DoS (Deny-of-Service) — атака на отказ в обслуживании

DOS (Disk Operating System) — дисковая операционная система dpi (dots per inch) — количество точек на дюйм

DRAM (Dynamic RAM) — ОЗУ динамического типа

DVD (Digital Versatile Disk) — компакт-диск с высокой плотностью записи

FRAM (Ferroelectric RAM) - ферроэлектрическая память с произвольным доступом

HTML (Hyper Text Markup Language) — универсальный язык разметки гипертекста

HTTP (Hypertext Transfer Protocol) — протокол передачи гипертекста

IP (Internet Protocol) — маршрутный протокол Интернет

ISO (International Organization for Standardization) — Международная организация по стандартизации

LCD (Liquid Crystal Dispay) — жидкокристаллические индикаторы

LEP (Light Emission Platics) — самоизлучающие мониторы

MS (MicroSoft) Майкрософт — фирма-производитель программного обеспечения

OLE (Object Linking and Embedding) — принцип внедрения и связывания объектов

OMT(Object Modeling Technique) — технология объектного моделирования

OOSE (Object-Oriented Software Engineering) — объектно-ориентированная разработка программного обеспечения

OSI (Model of Open System Interconnections) — модель взаимодействия открытых систем

PC (Personal Computer) — персональный компьютер

PCI (Peripheral Component Interconnect) — общая шина настольных компьютеров

PCMCIA (Personal Computer Memory Card International Association) — общая шина переносных компьютеров

PDP (Plasma Display Panels) — плазменные мониторы

РL/1 (Programming Language One) - язык программирования (ПЛ/1)

РРМ (Page Per Minute) — количество страниц в минуту

RAM (Random Access Memory) - память со свободным доступом

RGB (Red Green Blue) — модель представления светоизлучающих графических объектов

RISC (Reduced Instruction Set Computer) — сокращенный набор команд фиксированной длины

ROM (Read Only Memory) — память только для чтения

SMTP (Simple Mail Transfer Protocol) — простой протокол пересылки почты

SRAM (Static RAM) — ОЗУ статического типа

STP (Shielded Twisted Par) — экранированная витая пара

TFT (Thin Film Transistor) — жидкокристаллический экран с тонкопленочным транзистором

ТСР (Transmission Control Protocol ) - транспортный протокол Интернет

UML (Unified Modeling Language) — унифицированный язык моделирования

URL (Uniform Resource Location) — унифицированный указатель ресурса

UTP (Unshielded Twisted Pair ) — неэкранированная витая пара

WYSIWYG (What You See Is What You Get) — принцип “что видишь (на экране), то и получишь (при печати на листе)”

WWW (World Wide Web) — Всемирная паутина

1. информация, информатика, информационные технологии

В жизни современного человека слово «информация» очень распространено и часто используется в разных контекстах. Информацией обычно называют любые сведения, которые кого-либо интересуют, которые мы получаем или передаем. Например, мы говорим: «В результате научных исследований нами получена информация о...» или «Из книг мы информированы о...», «По телевидению была передана информация о...».

Фундаментальной чертой цивилизации является рост производства и потребления информации во всех отраслях человеческой деятельности. Вся жизнь человека, так или иначе, связана с получением, накоплением, обработкой, передачей информации. Практически в любой деятельности человека: в процессе чтения книг, просмотра телепередач, в разговоре - мы постоянно получаем и обрабатываем информацию.

Начиная с XVII в. объем научной информации удваивался, примерно, каждые 20 лет, в настоящее время он удваивается в 5-6 лет и тенденция ускорения сохраняется. Одной из важнейших проблем человечества наших дней является лавинообразный рост потока информации в любой отрасли жизнедеятельности. Подсчитано, что современный специалист должен тратить около 80 % своего рабочего времени, чтобы уследить за всеми новыми работами в его области деятельности.

Увеличение объема используемой человеком информации и растущий спрос на нее обусловили появление отрасли знания, связанной с автоматизацией обработки информации, — информатики. Далее мы дадим более точное определение, понятию «информация», а также расскажем о предмете и задачах информатики, покажем ее большое прикладное значение и в связи с этим расскажем об информационных технологиях.

Информации

1,1.1, Понятие информации.

Термин информация используется во многих науках и во многих сферах человеческой деятельности. Он происходит от латинского слова «informatio», что означает «сведения, разъяснения, изложение». Несмотря на привычность этого термина, строгого и общепринятого определения не существует. В рамках рассматриваемой нами науки «информация» является первичным и, следовательно, неопределимым понятием, подобно понятиям «точка» в математике, «тело» в механике, «поле» в физике. Несмотря на то, что этому понятию невозможно дать строгое определение, имеется возможность описать его через проявляемые свойства и мы попытаемся это сделать.

Как известно, в материальном мире все физические объекты, окружающие нас, являются либо телами, либо полями. Физические объекты, взаимодействуя друге другом, порождают сигналы различных типов. В общем случае любой сигнал - это изменяющийся во времени "физический процесс. Такой процесс может содержать различные характеристики. Характеристика, которая используется для представления данных, называется параметром сигнала. Если параметр сигнала принимает ряд последовательных значений и их конечное число, то сигнал называется дискретным. Если параметр сигнала — непрерывная во времени функция, то сигнал называется непрерывным.

В свою очередь, сигналы могут порождать в физических телах изменения свойств. Это явление называется регистрацией сигналов. Сигналы, зарегистрированные на материальном носителе, называются данными. Существует большое количество физических методов регистрации сигналов на материальных носителях. Это могут быть механические воздействия, перемещения, изменения формы или магнитных, электрических, оптических параметров, химического состава, кристаллической структуры. В соответствии с методами регистрации, данные могут храниться и транспортироваться на различных носителях. Наиболее часто используемый и привычный носитель -бумага; сигналы регистрируются путем изменения ее оптических свойств. Сигналы могут быть зарегистрированы и путем изменения магнитных свойств полимерной ленты с нанесенным ферромагнитным покрытием, как это делается в магнитофонных записях, и путем изменения химических свойств в фотографии.

Данные несут информацию о событии, но не являются самой информацией, так как одни и те же данные могут восприниматься (отображаться или еще говорят интерпретироваться) в сознании разных людей совершенно по-разному. Например, текст, написанный на русском языке (т.е. данные), даст различную информацию человеку, знающему алфавит и язык, и человеку, не знающему их.

Чтобы получить информацию, имея данные, необходимо к ним применить методы, которые преобразуют данные в понятия, воспринимаемые человеческим сознанием. Методы, в свою очередь, тоже различны. Например, человек, знающий русский язык, применяет адекватный метод, читая русский текст. Соответственно, человек, не знающий русского языка и алфавита, применяет неадекватный метод, пытаясь понять русский текст. Таком образом, можно считать, что информация ~ это продукт взаимодействия данных и адекватных методов.

Из вышесказанного следует, что информация не является статическим объектом, она появляется и существует в момент слияния методов и данных, все прочее время она находится в форме данных. Момент слияния данных и методов называется информационным процессом (рис. 1.1).

Рис. 1.1. Формирование информации

Человек воспринимает первичные данные различными органами чувств (их у нас пять — зрение, слух, осязание, обоняние, вкус), и на их основе сознанием могут быть построены вторичные абстрактные (смысловые, семантические) данные.

Таким образом, первичная информация может существовать в виде рисунков, фотографий, звуковых, вкусовых ощущений, запахов, а вторичная — в виде чисел, символов, текстов, чертежей, радиоволн, магнитных записей.

1.1.2, Свойства информации

Понятие «информация», как уже было сказано ранее, используется многими научными дисциплинами, имеет большое количество разнообразных свойств, но каждая дисциплина обращает внимание на те свойства информации, которые ей наиболее важны. В рамках нашего рассмотрения наиболее важными являются такие свойства, как дуализм, полнота, достоверность, адекватность, доступность, актуальность. Рассмотрим их подробнее.

Дуализм информации характеризует ее двойственность. С одной стороны, информация объективна в силу объективности данных, с другой - субъективна, в силу субъективности применяемых методов. Иными словами, методы могут вносить в большей или меньшей степени субъективный фактор и таким образом влиять на информацию в целом. Например, два человека читают одну и ту же книгу и получают подчас весьма разную информацию, хотя прочитанный текст, т.е. данные, были одинаковы. Более объективная информация применяет методы с меньшим субъективным элементом.

Полнота информации характеризует степень достаточности данных для принятия решения или создания новых данных на основе имеющихся. Неполный набор данных оставляет большую долю неопределенности, т.е. большое число вариантов выбора, а это потребует применения дополнительных методов, например, экспертных оценок, бросание жребия и т.п. Избыточный набор данных затрудняет доступ к нужным данным, создает повышенный информационный шум, что также вызывает необходимость дополнительных методов, например, фильтрацию, сортировку. И неполный и избыточный наборы затрудняют получение информации и принятие адекватного решения.

Достоверность информации — это свойство, характеризующее степень соответствия информации реальному объекту с необходимой точностью. При работе с неполным набором данных достоверность информации может характеризоваться вероятностью, например, можно сказать, что при бросании монеты с вероятностью 50 % выпадет герб.

Адекватность информации выражает степень соответствия создаваемого с помощью информации образа реальному объекту, процессу, явлению. Полная адекватность достигается редко, так как обычно приходится работать с не самым полным набором данных, т.е. присутствует неопределенность, затрудняющая принятие адекватного решения. Получение адекватной информации также затрудняется при недоступности адекватных методов.

Доступность информации — это возможность получения информации при необходимости. Доступность складывается из двух составляющих: из доступности данных и доступности методов. Отсутствие хотя бы одного дает неадекватную информацию.

Актуальность информации. Информация существует во времени, так как существуют во времени все информационные процессы. Информация, актуальная сегодня, может стать совершенно ненужной по истечении некоторого времени. Например, программа телепередач на нынешнюю неделю будет неактуальна для многих телезрителей на следующей неделе.

1.1,3. Понятие количество, информации

Свойство полноты информации негласно предполагает, что имеется возможность измерять количество информации. Какое количество информации содержится в данной книге, какое количество информации в популярной песенке? Что содержит больше информации: роман «Война и мир» или сообщение, полученное в письме от товарища? Ответы на подобные вопросы не просты и не однозначны, так как во всякой информации присутствует субъективная компонента. А возможно ли вообще объективно измерить количество информации? Важнейшим результатом теории информации является вывод о том, что в определенных, весьма широких условиях, можно, пренебрегая качественными особенностями информации, выразить ее количество числом, а следовательно, сравнивать количество информации, содержащейся в различных группах данных.

Количеством информации называют числовую характеристику информации, отражающую ту степень неопределенности, которая исчезает после получения информации.

Рассмотрим пример: дома осенним утром, старушка предположила, что могут быть осадки, а могут и не быть, а если будут, то в форме снега или в форме дождя, т.е. «бабушка надвое сказала — то ли будет, то ли нет, то ли дождик, то ли снег». Затем, выглянув в окно, увидела пасмурное небо и с большой вероятностью предположила — осадки будут, т.е., получив информацию, снизила количество вариантов выбора. Далее, взглянув на наружный термометр, она увидела, что температура отрицательная, значит, осадки следует ожидать в виде снега. Таким образом, получив последние данные о температуре, бабушка получила полную информацию о предстоящей погоде и исключила все, кроме одного, варианты выбора.

Приведенный пример показывает, что понятия «информация», '•неопределенность», «возможность выбора» тесно связаны. Получаемая информация уменьшает число возможных вариантов выбора (т.е. неопределенность), а полная информация не оставляет вариантов вообще.

За единицу информации принимается один бит (англ. bit –binary digit — двоичная цифра). Это количество информации, при котором неопределенность, т.е. количество вариантов выбора, уменьшается вдвое или, другими словами, это ответ на вопрос, требующий односложного разрешения — да или нет.

Бит — слишком мелкая единица измерения информации. На практике чаще применяются более крупные единицы, например, байт., являющийся последовательностью из восьми бит. Именно восемь битов, или один байт, используется для того, чтобы закодировать символы алфавита, клавиши клавиатуры компьютера. Один байт также являе1ся минимальной единицей адресуемой памяти компьютера, т.е. обратиться в память можно к байту, а не биту.

Широко используются еще более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 2¹⁰байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 2²⁰ байт,

1 Гигабайт (Гбайт) - 1024 Мбайт - 2'° байт,

1 Терабайт (Тбайт) = 1024 Гбайт = 2⁴⁰ байт.

За единицу информации можно было бы выбрать количество

информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации. Но данная единица используется редко в компьютерной технике, что связано с аппаратными особенностями компьютеров.

1,1,4. информационные процессы

Получение информации тесно связано с информационными

процессами, поэтому имеет смысл рассмотреть отдельно их виды.

Сбор данных - это деятельность субъекта по накоплению данных с целью обеспечения достаточной полноты. Соединяясь с адекватными методами, данные рождают информацию, способную помочь в принятии решения. Например, интересуясь ценой товара, его потребительскими свойствами, мы собираем информацию для того, чтобы принять решение: покупать или не покупать его.

Передача данных - это процесс обмена данными. Предполагается, что существует источник информации, канал связи, приемник информации, и между ними приняты соглашения о порядке обмена данными, эти. соглашения называются протоколами обмена. Например, в обычной беседе между двумя людьми негласно принимается соглашение, не перебивать друг друга во время разговора.

Хранение данных - это поддержание данных в форме, постоянно готовой к выдаче их потребителю. Одни и те же данные могут быть востребованы не однажды, поэтому разрабатывается способ их хранения (обычно на материальных носителях) и методы доступа к ним по запросу потребителя.

Обработка данных - это процесс преобразования информации от исходной ее формы до определенного результата. Сбор, накопление, хранение информации часто не являются конечной целью информационного процесса. Чаще всего первичные данные привлекаются для решения какой-либо проблемы, затем они преобразуются шаг за шагом в соответствии с алгоритмом решения задачи до получения выходных данных, которые после анализа пользователем предоставляют необходимую информацию.

1.1.5. Информация в жизни человечества.

Как мы уже выяснили, человечество со дня своего выделения из животного мира значительную часть своего времени и внимания уделяло информационным процессам.

На первых этапах носителем данных была память, и информация от одного человека к другому передавалась устно. Этот способ передачи информации был ненадежен и подвержен большим искажениям, ввиду естественного свойства памяти утрачивать редко используемые данные.

По мере развития цивилизации, объемы информации, которые необходимо было накапливать и передавать, росли, и человеческой памяти стало не хватать — появилась письменность. Это великое изобретение было сделано шумерами около шести тысяч лет назад. Оно позволило наряду с простыми записями счетов, векселей, рецептов записывать наблюдения за звездным небом, за погодой, за природой. Изменился смысл информационных сообщений. Появилась возможность обобщать, сопоставлять, переосмысливать ранее сохраненные сведения. Это же в свою очередь дало толчок развитию истории, литературы, точным наукам и в конечном итоге изменило общественную жизнь. Изобретение письменности характеризует первую информационную революцию.

Дальнейшее накопление человечеством информации привело к увеличению числа людей, пользовавшихся ею, но письменные труды одного человека могли быть достоянием небольшого окружения. Возникшее противоречие было разрешено созданием печатного станка. Эта веха в истории цивилизации характеризуется как вторая информационная революция началась и XVI в.). Доступ к информации перестал быть уделом избранных, появилась возможность многократно увеличить объем обмена информацией, что привело к большим изменениям в науке, культуре и общественной жизни.

Третья информационная революция связывается с открытием электричества и появлением (в конце XIX в.) на его основе новых средств коммуникации - телефона, телеграфа, радио. Возможности накопления информации для тех времен стали поистине безграничными, а скорость обмена очень высокой.

К середине XX в. появились быстрые технологические процессы, управлять которыми человек не успевал. Проблема управления техническими объектами могла решаться только с помощью универсальных автоматов, собирающих, обрабатывающих данные и выдающих решение в форме управляющих команд. Ныне эти автоматы называются компьютерами. Бурно развивавшаяся наука и промышленность привели к росту Информационных ресурсов в геометрической прогрессии, что породило проблемы доступа к большим объемам информации.

Наше время отмечается как четвертая информационная революция. Пользователями информации стали миллионы людей. Появились дешевые компьютеры, доступные миллионам пользователей. Компьютеры стали мультимедийными,, т.е. они обрабатывают различные виды информации: звуковую, графическую, видео и др. Это, в свою очередь, дало толчок к широчайшему использованию компьютеров в различных областях науки, техники, производства, быта. Средства связи получили повсеместное распространение, а компьютеры для совместного участия в информационном процессе соединяются в компьютерные сети. Появилась всемирная компьютерная сеть Интернет, услугами которой пользуется значительная часть населения планеты, оперативно получая и обмениваясь данными, т.е. формируется единое мировое информационное пространство.

В настоящее время круг людей, занимающихся обработкой информации, вырос до небывалых размеров, а скорость обмена стала просто фантастической, компьютеры применяются практически во всех областях жизни людей.

На наших глазах появляется информационное общество, где акцент внимания и значимости смещается с традиционных видов ресурсов (материальные, финансовые, энергетические и пр.) на информационный ресурс, который, хотя всегда существовал, но не рассматривался ни как экономическая, ни как иная категория.

Информационные ресурсы - это отдельные документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других информационных системах). Иными словами, информационные ресурсы — это знания, подготовленные людьми для социального использования в обществе и зафиксированные на материальном носителе. Информационные ресурсы страны, региона, организации все чаще рассматриваются как стратегические ресурсы, аналогичные по значимости запасам сырья, энергии, ископаемых и прочим ресурсам.

Развитие мировых информационных ресурсов позволило:

• превратить деятельность по оказанию информационных услуг в
глобальную человеческую деятельность;

• сформировать мировой и внутригосударственный рынок информационных услуг;

• повысить обоснованность и оперативность принимаемых решений в фирмах, банках, биржах, промышленности, торговле и др.
за счет своевременного использования необходимой информации.

1.2. Предмет и структура информатики

Термин информатика получил распространение с середины
80-х гг. прошлого века. Он состоит из корня inform - «информация»
и суффикса matics - «наука о...». Таким образом, информатика — это
наука об информации. В англоязычных странах термин не прижился, информатика там называется Computer Science — наука о компьютерах.

Информатика — молодая, очень бурно развивающаяся наука, поэтому строгого и точного определения ее предмета пока не сформулировано. В одних источниках информатика определяется как наука, изучающая алгоритмы, т.е. процедуры, позволяющие за конечное число шагов преобразовать исходные данные в конечный результат, в других — на первый план выставляется изучение компьютерных технологий. Наиболее устоявшимися посылками в определении предмета информатики в настоящее время являются указания на изучение информационных процессов (т.е. сбора, хранения, обработки, передачи данных) с применением компьютерных технологий. При таком подходе наиболее точным, по нашему мнению, является следующее определение:

Информатика — это наука, изучающая:

- методы реализации информационных процессов средствами вычислительной техники (СВТ);

-состав, структуру, общие принципы функционирования СВТ;

- принципы управления СВТ.

. Из определения следует, что информатика — прикладная наука, использующая научные достижения многих наук. Кроме того, информатика — практическая наука, которая не только занимается описательным изучением перечисленных вопросов, но и во многих случаях предлагает способы их решения. В этом смысле информатика технологична и часто смыкается с информационными технологиями.

Методы реализации информационных процессов находятся на стыке информатики с теорией информации, статистикой, теорией кодирования, математической логикой, документоведением и т.д. В этом разделе изучаются вопросы:

• представление различных типов данных (числа, символы, текст,
звук, графика, видео и т.д.) в виде, удобном для обработки СВТ
(кодирование данных);

• форматы представления данных (предполагается, что одни и те
же данные могут быть представлены разными способами);

• теоретические проблемы сжатия данных;

• структуры данных, т.е. способы хранения с целью удобного доступа к данным.

В изучении состава, структуры, принципов функционирования средств вычислительной техники используются научные положения из электроники, автоматики, кибернетики. В целом этот раздел информатики известен как аппаратное обеспечение (АО) информационных процессов. В этом разделе изучаются:

• основы построения элементов цифровых устройств;

• основные принципы функционирования цифровых вычисли
тельных устройств;

• архитектура СВТ — основные принципы функционирования
систем, предназначенных для автоматической обработки данных;

• приборы и аппараты, составляющие аппаратную конфигурацию
вычислительных систем;-

• приборы и аппараты, составляющие аппаратную конфигурацию
компьютерных сетей.

В разработке методов управления средствами вычислительной ^техники (а средствами цифровой вычислительной техники управляют программы, указывающие последовательность действий, которые должно выполнить СВТ) используют научные положения из теории алгоритмов, логики, теории графов, лингвистики, теории игр. Этот раздел информатики известен как программное обеспечение (ПО) СВТ. В этом разделе изучаются:

• средства взаимодействия аппаратного и программного обеспечения;

• средства взаимодействия человека с аппаратным и программным
обеспечением, объединяемые понятием интерфейс;

• программное обеспечение СВТ (ПО).

Обобщая сказанное, можно предложить следующую структурную схему (рис. 1.2):

Рис. 1.2. Структура информатики

В настоящей главе будут подробно рассмотрены некоторые проблемы представления данных различных типов: числовых, символьных, звуковых, графических. Также будут рассмотрены некоторые структуры, позволяющие хранить данные с возможностью удобного доступа к ним.

Вторая глава посвящена аппаратному обеспечению информационных процессов. В ней рассматриваются вопросы синтеза цифровых устройств, устройство электронно-вычислительных машин, устройство отдельных элементов аппаратного обеспечения.

Третья составляющая информатики — программное обеспечение -неоднородна и имеет сложную структуру, включающую несколько уровней:системный,. служебный, инструментальный, прикладной.

На низшем уровне находятся комплексы программ, осуществляющих интерфейсные функции, (посреднические между человеком и компьютером, аппаратным и программным обеспечением, между одновременно работающими программами), т.е. распределения различных ресурсов компьютера. Программы этого уровня называются системными. Любые пользовательские программы запускаются под управлением системных программ, называемых операционными системами.

Следующий уровень — это служебное программное обеспечение. Программы этого уровня называются утилитами, выполняют различные вспомогательные функции. Это могут быть ремонтные или диагностические программы, используемые при обслуживании различных устройств (гибкого и жесткого диска), тестовые программы, представляющие комплекс программ технического обслуживания, архиваторы, антивирусы и т.п. Служебные программы, как правило, работают под управлением операционной системы (хотя могут и непосредственно обращаться к аппаратному обеспечению), поэтому они рассматриваются как более высокий уровень. В некоторых классификациях системный и служебный уровни объединяются в один класс - системного программного обеспечения (см. главу 3).

Инструментальное программное обеспечение представляет комплекс программ для создания других программ. Процесс создания новых программ на языке машинных команд очень сложен и кропотлив, поэтому он низкопроизводителен. На практике большинство программ составляется на формальных языках программирования, которые более близки к математическому, следовательно, проще и производительней в работе, а перевод программ на язык машинных кодов осуществляет компьютер посредством инструментального программного обеспечения. Программы инструментального программного обеспечения управляются системными программами, поэтому они относятся к более высокому уровню.

Прикладное программное обеспечение — самый большой по объему класс программ, это программы конечного пользователя. В четвертой главе будет дано подробное описание и классификация программ, входящих в этот класс. Пока же скажем, что в мире существует около шести тысяч различных профессий, тысячи различных увлечения и большинство из них в настоящее время имеет какие-либо свои прикладные программные продукты. Прикладное программное обеспечение также управляется системными программами, и имеет более высокий уровень.

Обобщая сказанное, можно предложить следующую структуру программного обеспечения (рис. 1,3).

Рис.1.3. Классификация программного обеспечения

Предложенная классификация программного обеспечения является в большой мере условной, так как в настоящее время программные продукты многих фирм стали объединять в себе программные элементы из разных классов. Например, операционная система Windows, являясь комплексом системных программ, в своем составе содержит блок служебных программ (дефрагментация, проверка, очистка диска и др.), а также текстовый процессор WorldPad, графический редактор Paint, которые принадлежат классу прикладных программ.

1.3. Представление (кодирование) данных

Чтобы работать с данными различных видов, необходимо унифицировать форму их представления, а это можно сделать с помощью кодирования. Кодированием мы занимаемся довольно часто, например, человек мыслит весьма расплывчатыми понятиями, и, чтобы донести мысль от одного человека к другому, применяется язык. Язык - это система кодирования понятий, Чтобы записать слова языка, применяется опять же кодирование — азбука. Проблемами универсального кодирования занимаются различные области науки, техники, культуры. Вспомним, что чертежи, ноты, математические выкладки являются тоже некоторым кодированием различных информационных объектов. Аналогично, универсальная система кодирования требуется для того, чтобы большое количество различных видов информации можно было бы обработать на компьютере.

Подготовка данных для обработки на компьютере (представление данных) в информатике имеет свою специфику, связанную с электроникой. Например, мы хотим проводить расчеты на компьютере. При этом нам придется закодировать цифры, которыми записаны числа. На первый взгляд, представляется вполне естественным кодировать цифру ноль состоянием электронной схемы, где напряжение на некотором элементе будет равно 0 вольт, цифру единица — I вольт, двойку — 2 вольт и т.д., девятку — 9 вольт. Для записи каждого разряда числа в этом случае потребуется элемент электронной схемы, имеющий десять состояний. Однако элементная база электронных схем имеет разброс параметров, что может привести к появлению напряжения, скажем, 3,5 вольт, а оно может быть истолковано и как тройка и как четверка, т.е. потребуется на уровне электронных схем объяснить компьютеру, где заканчивается тройка, а где начинается четверка. Кроме' того, придется создавать весьма непростые электронные элементы для производства арифметических операций с числами, т.е. на схемном уровне должны быть созданы таблица умножения - 10x10 = 100 схем и таблица сложения - тоже 100 схем. Для электроники 40-х гг. (время, когда появились первые вычислительные машины) это была непосильная задача. Еще сложнее выглядела бы задача обработки текстов, ведь русский алфавит содержит 33 буквы. Очевидно, такой путь построения вычислительных систем не состоятелен.

В то же время' весьма просто реализовались электронные схемы с двумя устойчивыми состояниями: есть ток — 1, нет тока — О, есть электрическое (магнитное) поле — 1, нет — 0. Взгляды создателей вычислительной техники были обращены на двоичное кодирование как универсальную форму представления данных для дальнейшей обработки их средствами вычислительной техники. Предполагается, что данные располагаются в некоторых ячейках, представляющих упорядоченную совокупность из двоичных разрядов, а каждый может временно содержать одно из состояний — 0 или 1. Тогда группа из двух двоичных разрядов (двух бит) может закодировать 2²= 4 различные комбинации кодов (00 01 10 11); аналогично, три бита дадут 2³ = 8 комбинаций, восемь бит или 1 байт — 2^я = 256 и т.д.

Итак, внутренняя азбука компьютера очень бедна, содержит всего два символа: О, 1 поэтому и возникает проблема представления всего многообразия типов данных — чисел, текстов, звуков, графических изображений, видео и др., только этими двумя символами, с целью дальнейшей обработки средствами вычислительной техники. Вопросы представления некоторых типов данных мы рассмотрим в последующих параграфах.

1.3.1. Представление чисел в двоичном коде

Существуют различные способы записи чисел, например: можно записать число в виде текста — сто двадцать три; римской системе счисления CXXIII; арабской - 123.

Системы счисления

Совокупность приемов записи и наименования чисел называется системой счисления.

Числа записываются с помощью символов, и по количеству символов, используемых для записи числа, системы счисления подразделяются на позиционные и непозиционные. Если для записи числа используется бесконечное множество символов, то система счисления называется непозиционной. Примером непозиционной системы счисления может служить римская. Например, для записи числа один используется буква I, два и три выглядят как совокупности символов II, III, но для записи числа пять выбирается новый символ V, шесть — VI, десять — вводится символ X, сто — С, тысяча — М и т.д. Бесконечный ряд чисел потребует бесконечного числа символов для записи чисел. Кроме того, такой способ записи чисел приводит к очень сложным правилам арифметики.

Позиционные системы счисления для записи чисел используют ограниченный набор символов, называемых цифрами, и величина числа зависит не только от набора цифр, но и от того, в какой последовательности записаны цифры, т.е. от позиции, занимаемой цифрой, например, 125 и 215. Количество цифр, используемых для записи числа, называется основанием системы счисления, в дальнейшем его обозначим q.

В повседневной жизни мы пользуемся десятичной позиционной системой счисления, q = 10, т.е. используется 10 цифр: 0123456 7 8 9.

Рассмотрим правила записи чисел в позиционной десятичной системе счисления. Числа от 0 до 9 записываются цифрами, для записи следующего числа цифры не существует, поэтому вместо 9 пишут 0, но левее нуля образуется еще один разряд, называемый старшим, где записывается (прибавляется) 1, в результате получается 10. Затем пойдут числа 11, 12, но на 19 опять младший разряд заполнится и мы его снова заменим на 0, а старший разряд увеличим на 1, получим 20. Далее по аналогии 30, 40 ... 90, 91, 92... до 99. Здесь заполненными оказываются два разряда сразу; чтобы получить следующее число, мы заменяем оба на 0, а в старшем разряде, теперь уже третьем, поставим 1, т.е. 100, и т.д. до бесконечности, причем заметим, что при конечном числе цифр можно записать любое сколь угодно большое число. Заметим также, что производство арифметических действий в десятичной системе счисления весьма просто.

Число в позиционной системе счисления с основанием q может быть представлено в виде полинома по степеням q. Например, в десятичной системе мы имеем число

а в общем виде это правило запишется так:

Здесь X₍_q₎ - запись числа в системе счисления с основанием q; х₍_i₎. - натуральные числа меньше q, т.е. цифры;

n— число разрядов целой части;

m - число разрядов дробной части.

Записывая слева направо цифры числа, мы получим закодированную запись числа в q-ичной системе счисления:

В информатике, вследствие применения электронных средств вычислительной техники, большое значение имеет двоичная система счисления, q = 2 . На ранних этапах развития вычислительной техники арифметические операции с действительными числами производились в двоичной системе ввиду простоты их реализации в электронных схемах вычислительных Машин. Например, таблица сложения и таблица умножения будут иметь по четыре правила:

0 + 0 = 0 0x0 = 0

0 +1 = 1 0 х 1 =0

1 +0=1 1 х 0 = 0

1 + 1 = 10 1x1 = 1

А значит, для реализации поразрядной арифметики в компьютере потребуются вместо двух таблиц по сто правил в десятичной системе счисления две таблицы по четыре правила в двоичной. Соответственно на аппаратном уровне вместо двухсот электронных схем —
восемь. .

Но запись числа в двоичной системе счисления длиннее записи того же числа в десятичной системе счисления в log₂ 10 раз (примерно в 3,3 раза). Это громоздко и не удобно для использования, так как нормальный объем человеческого внимания составляет примерно три-четыре объекта, т.е. удобно будет пользоваться такими системами счисления, в которых наиболее часто используемые числа (от единиц до тысяч) записывались бы одной-четырьмя цифрами. Как это будет показано далее, перевод числа, записанного в двоичной системе счисления, в восьмеричную и шестнадцатеричную очень сильно упрощается по сравнению с переводом из десятичной в двоичную. Запись же чисел в них в три раза короче для восьмеричной и в четыре для шестнадцатеричной системы, чем в двоичной, но длины чисел в десятичной, восьмеричной и шестнадцатеричной системах счисления будут различаться ненамного. Поэтому, наряду с двоичной системой счисления, в информатике имеют хождение восьмеричная и шестнадцатеричная системы счисления.

Восьмеричная система счисления имеет восемь цифр: 01234 567. Шестнадцатеричная - шестнадцать, причем первые 10 цифр совпадают по написанию с цифрами десятичной системы счисления, а для обозначения оставшихся шести цифр применяются большие латинские буквы, т.е. для шестнадцатеричной системы счисления получим набор цифр: 0123456789АВСОЕЕ

Если из контекста не ясно, к какой системе счисления относится запись, то основание системы записывается после числа в виде нижнего индекса. Например, одно и то же число 231, записанное в десятичной системе, запишется в двоичной, восьмеричной и шестнадцатеричной системах счисления следующим образом:

231₍₁₀₎=11100111₍₂₎=347₍₈₎=Е7₍₁₆₎.

Запишем начало натурального ряда в десятичной, двоичной, восьмеричной и шестнадцатеричной системах счисления.

Десятичная Двоичная Восьмеричная Шестнадцате-ричная

Десятичная Двоичная Восьмеричная Шестнадца-теричная

ПО

А

В

С

О

Е

Р

Преобразование чисел из одной системы счисления в другую

Так как десятичная система для нас удобна и привычна, все арифметические действия мы делаем в ней, и преобразование чисел из произвольной недесятичной (q не равно 10) системы в десятичную удобно выполнять на основе разложения по степеням q, например:

Преобразование из десятичной в прочие системы счисления проводится с помощью правил умножения и деления. При этом целая и дробная части переводятся отдельно.

Рассмотрим алгоритм на примере перевода десятичного числа 231 в двоичную систему (совершенно аналогичен перевод из десятичной системы в любую q-ичную). Разделим число на два (основание системы): нацело \ остаток 1, т.е. можно записать

Число 115 (такой двоичной цифры нет) тоже может быть разделено нацело на 2, т.е. 115 : 2 = 57 и остаток 1. По аналогии запишем

Таким образом, последовательное деление нацело позволяет разложить число по степеням двойки, а это в краткой записи и есть двоичное изображение числа.

Эти выкладки можно сократить, записав процесс деления следующим образом:

Читая частное и остатки от деления в порядке, обратном получению, получим двоичную запись числа. Такой способ перевода чисел называется правилом (алгоритмом) последовательного деления, очевидно, что он применим для любого основания.

Для дробных чисел правило последовательного деления заменяется правилом последовательного умножения, которое также рассмотрим на примере. Переведем 0,8125 из десятичной системы в двоичную систему счисления.

Умножим его на 2,

т.е. 0,8125 х 2 = 1,625 или 0,8125 - (1 + 0,625) хх 2^-1 = 1 х 2^-1 + 0,625 х 24

Попутно заметим, что в десятичной системе счисления правильная дробь переводится в десятичную дробь в конечном виде только в том случае, если ее знаменатель в качестве множителей имеет только степени двоек и пятерок, т.е. дробь имеет вид

тальные дроби переводятся в бесконечные периодические дроби. Аналогично в двоичной системе счисления конечный вид получают дроби, где в знаменателе только степени двойки, т.е. большинство десятичных конечных дробей в двоичной системе счисления будут бесконечными периодическими дробями.

Если ведутся приближенные вычисления, то последний разряд является сомнительным, и для обеспечения в приближенных вычислениях одинаковой точности в двоичной и десятичной записях числа без бесконечных дробей, достаточно взять число двоичных разрядов в (1оg₂10 ~ 3,3) 4 раза больше, чем .десятичных.

Между двоичной системой счисления, с одной стороны, и восьмеричной и шестнадцатеричной (заметим 8 и 16 — есть третья и четвертая степени двойки) — с другой, существует связь, позволяющая легко переводить числа из одной системы в другую. Рассмотрим на примере:

231,8125₍₁₀₎=11100111,1101₍₂₎ = 1 х 2⁷ + 1 х 2⁶ + 1 х 2⁵ + 1 х 2² + + 1 х2¹+ 1 х2⁰ + 1 х2^-1+ 1 х 2-41 х 2^-4.

Для перевода в шестнадцатеричную систему счисления сгруппируем целую и дробную части в группы по четыре члена и вынесем в каждой группе за скобки множители, кратные 2⁴. Получим:

(1 х 2³ + 1 х 2² + 1 х 2¹ + 0 х 2⁰) х 2⁴ + (1 х 2³ + 1 х 2² + 1 х 2¹ + + 1 х 2⁰) + (1 х 2³ + 1 х 2² + 0 х 2¹ + 1 х 2⁰) х 2^-4= (1 х 2³ + 1 х 2² + + 1 х 2¹ + 0) х 16¹ + (1 х 2² + 1 х 2¹ + 1 x 2⁰) х 16⁰ + (1 х 2³ + 1 х 2² + + 0 х 2¹ +0 х 2⁰) х 16^-1 = 14 х 16¹ + 7 х 16⁰ + 13 х 16^-1 = Е7.D₍₁₆₎

Резюмируя, заключаем: для того, чтобы перевести число из двоичной системы в шестнадцатеричную, надо от десятичной запятой вправо и влево выделить группы по четыре цифры (они называются тетрадами), и каждую группу независимо от других перевести в одну шестнадцатеричную цифру.

Аналогичное правило для восьмеричной системы читатель выведет сам.

Представление чисел в двоичном коде

Представление чисел в памяти компьютера имеет специфическую особенность, связанную с тем, что в памяти компьютера они должны располагаться в байтах - минимальных по размеру адресуемых (т.е. к ним возможно обращение) ячейках памяти. Очевидно, адресом числа следует считать адрес первого байта. В байте может содержаться произвольный код из восьми двоичных разрядов, и задача представления состоит в том, чтобы указать правила, как в одном или нескольких байтах записать число.

Действительное число многообразно в своих «потребительских свойствах». Числа могут быть целые точные, дробные точные, рациональные, иррациональные, дробные приближенные, числа могут быть положительными и отрицательными. Числа могут быть «карликами», например, масса атома, «гигантами», например, масса земли, реальными, например, количество студентов в группе, возраст, рост. И каждое из перечисленных чисел потребует для оптимального представления в памяти свое количество байтов.

Очевидно, единого оптимального представления для всех действительных чисел создать невозможно, поэтому создатели вычислительных систем пошли по пути разделения единого по сути множества чисел на типы (например, целые в диапазоне от ... до..., приближенные с плавающей точкой с количеством значащих цифр ...и т.д.). Для каждого в отдельности типа создается собственный способ представления.

Целые числа. Цельте положительные числа от 0 до 255 можно представить непосредственно в двоичной системе счисления (двоичном коде). Такие числа будут занимать один байт в памяти компьютера.

Число Двоичный код

О011

… …

В такой форме представления легко реализуется на компьютерах двоичная арифметика.

Если нужны и отрицательные числа, то знак числа может быть закодирован отдельным битом, обычно это старший бит; ноль интерпретируется как плюс, единица как минус. В таком случае одним байтом может быть закодированы целые числа в интервале от -127 до +127, причем двоичная арифметика будет несколько усложнена, так как в этом случае существуют два кода, изображающих число ноль 0000 0000 и 1000 0000, и в компьютерах на аппаратном уровне это потребуется предусмотреть. Рассмотренный способ представления целых чисел называется прямым кодом. Положение с отрицательными числами несколько упрощается, если использовать, так называемый, дополнительный код. В дополнительном коде положительные числа совпадают с положительными числами в прямом коде, отрицательные же числа получаются в результате вычитания из 1 0000 0000 соответствующего положительного числа. Например, число —3 получит код

В дополнительном коде хорошо реализуется арифметика, так как каждый последующий код получается из предыдущего прибавлением единицы с точностью до бита в девятом разряде. Например,

5 - 3 = 5 + (- 3).

Аналогично целые числа от 0 до 65536 и целые числа от - 32768 до 32767 в двоичной (шестнадцатеричной) системе счисления представляются в двухбайтовых ячейках. Существуют представления целых чисел и в четырехбайтовых ячейках.

Действительные числа. Действительные числа в математике представляются конечными или бесконечными дробями, т.е. точность представления чисел не ограничена. Однако в компьютерах числа хранятся в регистрах и ячейках памяти, которые представляют собой последовательность байтов с ограниченным количеством разрядов. Следовательно, бесконечные или очень длинные числа усекаются до некоторой длины и в компьютерном представлении выступают как приближенные. В большинстве систем программирования в написании действительных чисел целая и дробная части разделяются не запятой, а точкой.

Для представления действительных чисел, как очень маленьких, так и очень больших, удобно использовать форму записи чисел в виде произведения

где m - мантисса числа;

q- основание системы счисления;

р - целое число, называемое порядком.

Такой способ записи чисел называется представлением числа с плавающей тонкой.

То есть число 1234,56 может быть записано в одном из видов:

1234,56- 123,456-10¹= 12,3456-10²- 1,23456-10³ - 0,123456-10⁴.

Очевидно, такое представление не однозначно. Если мантисса 1 / q |m|< q (0,1 m < 1 для десятичной системы счисления), то представление числа становится однозначным, а такая форма называется нормализованной. Если «плавающая» точка расположена в мантиссе перед первой значащей цифрой, то при фиксированном количестве разрядов, отведенных под мантиссу, обеспечивается запись максимального количества значащих цифр числа, т.е., максимальная точность.

Действительные числа в компьютерах различных типов записываются по-разному, тем не менее, существует несколько международных стандартных форматов, различающихся по точности, но имеющих одинаковую структуру. Рассмотрим на примере 4-байтного числа.

Первый разряд представления используется для записи знака мантиссы. За ним следует группа разрядов, определяющих порядок, а остальные разряды определяют абсолютную величину мантиссы. Размеры обеих групп разрядов фиксируются.

Так как порядок может быть положительным или отрицательным, нужно решить проблему его знака. Величина порядка представляется с избытком, т.е., вместо истинного значения порядка хранится число, называемое характеристикой (или смещенным порядком). Для получения характеристики необходимо к порядку прибавить смещение. Например, при использовании, для хранения порядка восьми бит и значений от - 128 до + 127 используется смещение 128. Тогда для представления порядка будут использоваться значения от 0 до + 255, т.е. только неотрицательные числа.

Так как мантисса нормализованного числа всегда равна единице, некоторые схемы представления ее лишь подразумевают, используя лишний разряд для повышения точности представления мантиссы. Использование смещенной формы позволяет производить операции над порядками, как над беззнаковыми числами, что упрощает операции сравнения, сложения и вычитания порядков, а также упрощает операцию сравнения самих нормализованных чисел.

Чем больше разрядов отводится под запись мантиссы, тем выше точность представления числа. Чем больше разрядов занимает порядок, тем шире диапазон от наименьшего отличного от нуля числа до наибольшего числа, представимого в компьютере при заданном формате.

Как и в случае целых чисел, в программных системах могут использоваться несколько типов данных, реализующих модель с плавающей точкой. Например, в языке Си применяются три типа данных с разной «длиной». Шестнадцатиразрядные компиляторы для IBM-совместимых персональных компьютеров реализуют эти типы следующим образом.

float — 4 байта, из них 23 разряда мантиссы и 8 битов порядка (от 3,4 • 10^-38 до 3,4 • 10⁺³⁸, обеспечивает точность с 7 значащими цифрами);

double — 8 байтов, из них 52 разряда мантиссы и 11 битов порядка (от 1,7 • 10^-308 до 1,7 • 10⁺³⁰⁸, обеспечивает точность с 15 знаками);

long double ~ 10 байтов, из них 65 разрядов мантиссы и 14 битов порядка (от 3,4 • 10^-4932 до 3,4 • 10⁺⁴⁹³², обеспечивает точность с 19 знаками).

Понятие типа данных. Как уже говорилось, минимально адресуемой единицей памяти является байт, но представление числа требует большего объема. Очевидно, такие числа займут группу байт, а адресом числа будет адрес первого байта группы. Следовательно, произвольно взятый из памяти байт ничего нам не скажет о том, частью какого информационного объекта он является - целого числа, числа с плавающей запятой или команды. Резюмируя вышесказанное, можно сделать вывод, что кроме задачи представления данных в двоичном коде, параллельно решается обратная задача - задача интерпретации кодов, т.е. как из кодов восстановить первоначальные данные.

Для представления основных видов информации (числа целые, числа с плавающей запятой, символы, звук и т.д.) в системах программирования используют специального вида абстракции - типы данных. -Каждый тип данных определяет логическую структуру представления и интерпретации для соответствующих данных. В дальнейшем для каждого типа данных будут определены и соответствующие ему операции обработки.

1,3.2, Представление символьных и текстовых данных

Тексты являются важнейшим источником информации. Именно такой характер имеют экономические, плановые, учетные данные, представленные на естественном или искусственном языке. Каждый язык использует свою знаковую систему, основанную на алфавите. Письменность можно рассматривать как метод представления на материальных носителях знаков звуковой системы разговорного языка.

Для записи слов были изобретены буквы, для указания оттенков речи — знаки препинания. В настоящее время известно множество средств, позволяющих разнообразить письменные документы: шрифты, абзацы, заголовки, для создания четкой структуры документа используются главы, параграфы, оглавления, аннотации.

Рассмотрим последовательно, как кодируются символы, элементы текстов, текстовые документы

Символы. Двоичное кодирование символьных данных производится заданием кодовых таблиц, согласно которым каждому символу ставят в соответствие одно- или двухбайтовый код. Помимо этого, кодовая таблица ставит в соответствие кодам клавиши на клавиатуре и начертание символа на экране монитора. Обратная задача — интерпретация кодов осложнена тем, что в одном языке, как правило, существуют несколько кодовых таблиц. Это связано с тем, что кодовые таблицы разрабатывались в разных странах в разные времена.

Наиболее популярная таблица ASCII разработана институтом стандартизации США в 1981 г. Ее использовали, в частности, программные продукты, работающие под управлением операционной системы MS-DOS. Для представления одного символа используется оди
12
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Далее ⇒

Соболь Б.В., Галин А.Б., Панов Ю.В., Рашидова Е.В., Са­довой Н.Н.

Соболь Б.В., Галин А.Б., Панов Ю.В., Рашидова Е.В., Садовой Н.Н.