Алфавит ассемблера

Определим алфавит ассемблера, то есть допустимые для написания текста программ символы:

1) все латинские буквы А - Z, а - z, причем прописные и строчные буквы считаются эквивалентными;

2) цифры от 0 до 9;

3) специальные знаки _, ?, @, $, &;

4) разделители: „ ., [, ], (, ), <, >, {, }, +, /, *, %, !, ", ", ?, , = ,#,^.

Из символов алфавита состоят лексемы.

Лексемами языка ассемблера являются ключевые слова, идентификаторы, цепочки символов и целые числа.

Ключевые слова – это служебные символы языка ассемблера. По умолчанию регистр символов ключевых слов не имеет значения. К ключевым словам относятся:

§ названия регистров (AL, АН, BL, ВН, CL, СН, DL, ОН, АХ, ВХ, СХ, DX, ВР, SP, DI, SI, CS, DS, ES, SS);

§ операторы (BYTE, WORD, DWORD, AND, NOT, HIGH, LOW, HIGHWORD, LOWWORD, OFFSET, SEG, TYPE, THIS, PTR, WIDTH, MASK, SIZE, SIZEOF, LENGTH, ST, SHORT, TYPE, MOD, NEAR, FAR, OR, XOR, EQ, NE, LT, LE, GT, GE, SHR)

§ названия команд (КОП) ассемблера, префиксов.

Идентификаторы – последовательности допустимых символов, использующиеся для обозначения имен переменных и меток. Идентификатор может состоять из одного или нескольких символов. В качестве символов можно использовать буквы латинского алфавита, цифры и некоторые специальные знаки — _, ?, $, @. Идентификатор не может начинаться символом цифры. Длина идентификатора может составлять до 255 символов, хотя транслятор воспринимает лишь первые 32, а остальные игнорирует.

Цепочки символов – это последовательности символов, заключенные в одинарные или двойные кавычки.

Целые числа могут указываться в двоичной, десятичной или шестнадцатеричной системах счисления.

Важно отметить наличие символов после (h) и перед (0) записью шестнадцатеричного числа. Это сделано для того, чтобы транслятор мог отличить в программе одинаковые по форме записи десятичные и шестнадцатеричные числа. К примеру, числа 1578 и 1578h выглядят одинаково, но имеют разные значения. Шестнадцатеричное число начинающиеся с цифр A, B,...F, например fe023, обязательно должно начинаться с нуля чтобы оно не определялось как идентификатор. Для данного примера правильная запись шестнадцатеричного числа – 0fe023h.

Для двоичных чисел после записи нулей и единиц, входящих в их состав, необходимо поставить латинскую букву «b». Пример: 10010101b.

Комментарий – это любая комбинация символов ASCII, расположенная в строке за символом точки с запятой (;), транслятором игнорируется.