Генератор внутреннего представления программы на М-языке

 

 

Каждый элемент в ПОЛИЗе - это лексема, т.е. пара вида (номер_класса, номер_в_классе). Нам придется расширить набор лексем:

1) будем считать, что новые операции (!, !F, R, W) относятся к классу ограничителей, как и все другие операции модельного языка;

2) для ссылок на номера элементов ПОЛИЗа введем лексемы класса 0, т.е. (0,p) - лексема, обозначающая p-ый элемент в ПОЛИЗе;

3) для того, чтобы различать операнды-значения-переменных и операнды-адреса-переменных (например, в ПОЛИЗе оператора присваивания), операнды-значения будем обозначать лексемами класса 4, а для операндов-адресов введем лексемы класса 5.

Будем считать, что генерируемая программа размещается в массиве P, переменная free - номер первого свободного элемента в этом массиве:

 

#define MAXLEN_P 10000

struct lex

{int class;

int value;}

struct lex P [ MAXLEN_P];

int free = 0;

 

Для записи очередного элемента в массив P будем использовать функцию put_lex:

 

void put_lex (struct lex l)

{P[ free++] = l;}

 

Кроме того, введем модификацию этой функции - функцию put_lex5, которая записывает лексему в ПОЛИЗ, изменяя ее класс с 4-го на 5-й (с сохранением значения поля value):

 

void put_lex5 (struct lex l)

{ l.class = 5; P[ free++] = l;}

 

Пусть есть функция

struct lex make_op(char *op),

которая по символьному изображению операции op находит в таблице ограничителей соответствующую строку и формирует лексему вида ( 2, i ), где i - номер найденной строки.

 

Генерация внутреннего представления программы будет проходить во время синтаксического анализа параллельно с контролем контекстных условий, поэтому для генерации можно использовать информацию, "собранную" синтаксическим и семантическим анализаторами; например, при генерации ПОЛИЗа выражений можно воспользоваться содержимым стека, с которым работает семантический анализатор.

Кроме того, можно дополнить функции семантического анализа действиями по генерации:

 

void checkop_p (void)

{char *op; char *t1; char *t2; char *res;

t2 = spop(); op = spop(); t1 = spop();

res = gettype (op,t1,t2);

if (strcmp (res, "no"))

{spush (res);

put_lex (make_op (op));} /* дополнение! - операция

op заносится в ПОЛИЗ */

else ERROR();

}

 

Тогда грамматика, содержащая действия по контролю контекстных условий и переводу выражений модельного языка в ПОЛИЗ, будет такой:

E ® E1 | E1 [ = | > | < ] <spush (TD [curr_lex.value] ) > E1<checkop_p() >

E1 ® T { [ + | - | or] <spush (TD [curr_lex.value] ) >T <checkop_p() >}

T ® F { [ * | / | and] <spush (TD [curr_lex.value] ) >F <checkop_p() >}

F ® I <checkid(); put_lex ( curr_lex ) > | N <spush("int"); put_lex (curr_lex) > |

[ true | false ] <spush ("bool"); put_lex (curr_lex) > |

not F <checknot(); put_lex (make_op ("not")) > | (E)

 

Действия, которыми нужно дополнить правило вывода оператора присваивания, также достаточно очевидны:

S ® I <checkid(); put_lex5 (curr_lex) > :=

E <eqtype(); put_lex (make_op (":=")) >

 

При генерации ПОЛИЗа выражений и оператора присваивания элементы массива P заполнялись последовательно. Семантика условного оператора if E then S1 else S2 такова, что значения операндов для операций безусловного перехода и перехода "по лжи" в момент генерации операций еще неизвестны:

if (!E) goto l2; S1; goto l3; l2: S2; l3:...

Поэтому придется запоминать номера элементов в массиве P, соответствующих этим операндам, а затем, когда станут известны их значения, заполнять пропущенное.

Пусть есть функция

struct lex make_labl (int k),

которая формирует лексему-метку ПОЛИЗа вида (0,k).

Тогда грамматика, содержащая действия по контролю контекстных условий и переводу условного оператора модельного языка в ПОЛИЗ, будет такой:

S ® if E <eqbool(); pl2 = free++; put_lex (make_op ("!F")) >

then S <pl3 = free++; put_lex (make_op ("!")); P[pl2] = make_labl (free) >

else S < P[pl3] = make_lable (free) >

 

Замечание: переменные pl2 и pl3 должны быть локализованы в процедуре S, иначе возникнет ошибка при обработке вложенных условных операторов.

Аналогично можно описать способ генерации ПОЛИЗа других операторов модельного языка.