Определение строковой переменной


Рис. 12. Данные строкового типа в памяти

Последовательность \0 называется нулевым символом и рассматривается как один символ.

 

Как вы помните, язык Си не содержит строкового типа данных и не имеет никаких средств для работы со строками. К счастью, Си позволяет работать с данными строкового типа, используя массивы. Раньше мы уже определяли строку как ряд последовательных символов. Именно этим она и является — рядом символьных переменных, объединенных в нечто, называемое массивом. Элементы строки хранятся вместе в последовательных элементах памяти. В качестве примера на рис.12 показано, как выглядит переменная, имеющая значение "Привет". Каждая буква хранится в отдельном элементе памяти так же, как одиночная символьная переменная, но вся строка может быть выведена на экран монитора как единое целое при помощи одной функции puts(). Последовательность \0 является специальным символом, который Си вставляет после каждой строки. Он отмечает конец строки, указывая функции типа puts(), где следует прекратить вывод символов на экран.

Вы уже знаете как определить строковую константу — с помощью директивы #define, заключив символы строки в кавычки:

#define CLIENT "Кейт Тиммонс"

Чтобы определить строковую переменную, необходимо использовать тип char и указать максимальное число символов, которое может содержать строка. Например, так:

char var_name[N];

где var_name означает имя переменной, а N — максимальное количество символов, которое всегда заключается в квадратные скобки: прямую [ и обратную ].

Число, указанное в скобках, должно быть на единицу больше максимального количества символов, которое вы собираетесь использовать, так как Си нуждается в дополнительном пространстве, чтобы поставить нулевой символ. Например, переменная, содержащая аббревиатуры названий штатов, может быть определена следующим образом:

char state[3];


Рис. 13. Определение строковой переменной

при этом, как показано на рис.13, создается строковая переменная, которая называется state и содержит два символа, плюс нулевой символ, означающий конец строки (\0).

Вы не можете записать в строку больше символов, чем было указано при ее определении, так как Си отводит ровно столько памяти, сколько необходимо для хранения заданного числа символов. Поэтому, прежде чем определять переменную, хорошенько подумайте, сколько символов может вам потребоваться.

Почему это так важно, можно пояснить на следующем жизненном примере. Допустим, вы вводите переменную, содержащую имена клиентов. Вы определили ее следующим образом:

char client[10];

Программа работает безупречно до тех пор, пока вы не получаете заказ от господина Флаглехоффена. Когда вы попытаетесь ввести его имя в список, ваша программа остановится из-за ошибки выполнения, что иллюстрирует рис.14.


Рис. 14. Нельзя присвоить строковой переменной значение,имеющее большее количество символов, чем было для нее зарезервировано

Для того чтобы избежать подобной неприятности, вы могли бы в определении переменной несколько увеличить допустимое количество символов:

char client[80];

но если в программе будет несколько таких переменных, вы впустую потратите немало памяти компьютера.

Определив строковую переменную, вы тут же можете инициализировать ее, присвоив ей начальное значение в тексте программы. Помимо этого, значение можно присвоить, введя его с клавиатуры или из дискового файла, как это делается для переменных любого другого типа (подробнее о том, как вводить значение строковой переменной с клавиатуры, вы узнаете в следующей лабораторной работе). В языке Си нельзя присваивать значение строковой переменной так, как это сделано в примере:

main() { char client[15]; client = "Кейт"; puts(client); }

где употребляется не разрешенная инструкция

client = "Кейт";

Если вы хотите присвоить начальное значение строковой переменной, это можно сделать, определив используемую переменную одним из двух допустимых способов.

Вы можете присвоить значение определением переменной перед функцией main():

char client[] = "Флаглехоффен"; main() { puts(client); }


Рис. 15. Инициализация строки

Заметьте, что в этом случае значение максимального числа символов строковой переменной в квадратных скобках не проставлено. Максимальное число символов строковой переменной при таком способе определения зависит от используемого компилятора, но практически определяется количеством символов в начальном значении плюс один (рис.15). Заметим, что в качестве параметра функции puts() используется только имя переменной без каких-либо квадратных скобок.

Другой способ присваивания начального значения внутри функции main() несколько более сложен:

main(){ static char greet[] = "Привет"; puts(greet);}

Определение выполняется внутри функции main(), но начинается со слова static, а переменная называется статической. Определяемая таким образом переменная может быть использована только внутри функции, в теле которой она была определена. Если вы желаете присвоить начальное значение строковой переменной, определяемой внутри функции, то ее следует определить как статическую переменную.

Типы данных и функции

Тип, присвоенный константе или переменной, определяет то, каким образом функции могут их использовать. Большинство функций может использовать в качестве параметров только данные определенного типа. Например, функция puts() может работать только со строками, так что при компиляции программы

#define PI 3.14 main() { puts(PI); }

будет возникать ошибка. Функция puts() не может работать с вещественными числами.

Распространенной ошибкой начинающих программистов является использование двойных кавычек при попытке определить символьную константу:

#define INITIAL "A"

Си воспримет определение как попытку задать строковую константу, и вы получите ошибку компиляции, когда попробуете использовать эту константу при вызове функции, требующей в качестве параметра данные типа char. Даже один символ, заключенный в двойные кавычки, рассматривается Си как строка.

Когда мы будем рассматривать ввод и вывод в следующих главах, обращайте особое внимание на то, данные какого типа использует в качестве параметров каждая функция.

Литералы

Литералом называется любой элемент данных, который вводится непосредственно в инструкции языка Си. Литералом может являться любое число, символ или строка, которые вы вводите как начальное значение переменной. В примере:

count = 5;

число 5 является литералом. Это означает, что вы хотите, чтобы именно это число было присвоено переменной в качестве ее значения. В примере:

#define INIT 'C'rate = 0.55;client = "Кейт";puts("555-1234");

буква C, число 0.55, слово Кейт и телефонный номер 555-1234 являются литералами.

Проектирование программы

Данные имеют огромное значение для программы на языке Си. Если перед тем как писать программу вы не решите как именно будете использовать данные, вероятность ошибок компиляции и выполнения вырастет во много раз.

В этой главе мы рассматривали константы и переменные в отношении данных, которые вы должны ввести в программу, но данные необходимо рассматривать и в качестве информации, которую вы хотите получить от программы. Для того чтобы это было возможно, надо определить также и переменные для хранения этой информации.

Фактически, многие программисты начинают писать план программы именно с вывода. Определив, какую именно информацию вы хотите получить от программы, легче определить, какую информацию необходимо ввести и как ее следует обрабатывать.

 

  Вопросы
  1. Что такое тип данных char?
  2. Чем символ '3' отличается от числа 3?
  3. Какой тип данных вы используете для записи стоимости товара в долларах?
  4. Почему может быть необходимо использование в программе типа данных long int?
  5. Для чего используется тип double float?
  6. В чем заключается различие между константой и переменной?
  7. Как определить константу?
  8. Поддерживает ли Си строковый тип данных?
  9. Сохраняет ли переменная свое значение в ходе выполнения всей программы?
  10. Как изменить значение константы?
 

 

    Упражнения
  1. Решите, какие типы данных вам необходимы, и напишите их определения для программы, которая рассчитывает недельную заработную плату сотрудника, получающего двойную оплату за сверхурочные часы (рабочая неделя — 40 часов).
  2. Решите, какие типы данных вам необходимы и напишите их определения для программы, которая рассчитывает сумму и среднее арифметическое значение четырех чисел.
3. Объясните, какие ошибки имеются в следующих инструкциях: char client[3]="Ajax"; main() float tax_due; char name(10); int count(5); tax_due = "$1635.00";