Алфавит и лексемы

 

Язык Паскаль, как и любой язык программирования имеет свой алфавит, синтаксис и семантику. Алфавит ¾ это набор допустимых в языке символов. Синтаксис ¾ это совокупность правил образования предложений языка. Синтаксические правила определяют требования к записи операторов языка программирования. Семантика ¾ это множество правил, определяющих смысл предложений языка. Семантические правила определяют, какие действия и в какой последовательности должна выполнить ЭВМ, выполняя программу на языке Паскаль.

Алфавит языка Паскаль является подмножеством набора символов кода ASCII и включает следующие символы:

§ прописные и строчные буквы латинского алфавита и символ подчеркивания;

§ арабские цифры;

§ специальные знаки: # $ ’ ( ) * + - , ; : . / < = > @ [ ] ^ { }

§ символ пробела;

§ управляющие символы.

Из символов алфавита формируются лексемы. Лексема ¾ это минимальная, смысловая единица текста программы. Классификация лексем языка Паскаль приведена на рис. 1.

Специальные символы ¾ это знаки операций, скобки и разделители.

Идентификатором называется последовательность латинских букв, цифр и знака подчеркивания, начинающаяся с буквы или знака подчеркивания. Прописные и строчные буквы в идентификаторах не различаются.

Зарезервированные ключевые слова ¾ это идентификаторы, зарезервированные в языке для специального использования; они служат для обозначения операторов и описателей данных. К ключевым словам относятся следующие идентификаторы:

and goto program

asm if record
array implementation repeat
begin in set
case inherited shl
const inline shr

 

 


 

           
   
   
 
лексема
 
 

 


       
 
 
   
Рис. 4.1

 


 


constructor interface string
destructor label then
div library to
do mod type
downto nil until
else not unit
end object uses
exports of var
file or while
for packed xor
function procedure

 

Пользовательские идентификаторы ¾ это имена типов, переменных, процедур и функций, определенных пользователем. Не допускается использование ключевых слов в качестве пользовательских идентификаторов.

Метки в Паскале могут относиться к оператору или его части ( в операторе case) и бывают числовыми или символьными. Метка отделяется от оператора двоеточием (:).

Числа в программах на Паскале используются целые и вещественные. Целые числа могут быть представлены в десятичной и шестнадцатеричной системах счисления. Целые десятичные числа записываются, как в математике, и должны находится в диапазоне от –2147483648 до +2147483647. Примеры: 35, -64, 0.

Для обозначения целых шестнадцатеричных чисел используется знак доллара ($), который записывается перед числом. Например, $A01, $0. Допустимый диапазон целых шестнадцатеричных чисел от $00000000 до $FFFFFFFF.

Вещественные числа записываются в виде десятичной дроби (вещественное число с фиксированной запятой) и в экспоненциальной форме (вещественное число с плавающей запятой). Примеры вещественных чисел с фиксированной запятой : 35.26; –90.5; 0.097. Во втором способе записи указываются мантисса и порядок числа, разделенные буквой ‘Е’:
<мантисса>E<порядок>. Например, 0.272Е+02, это означает

0.272 х 102= 27.1 .

Строка символов представляет собой последовательность символов, включающую буквы латинского и русского алфавита, цифры и специальные знаки и заключенную в кавычки. Например,

‘Н. Вирт – автор языка Паскаль’

‘Borland Pascal 7.0’

‘’ –пустая строка.

Строка, состоящая из одного символа, называется символьной константой. Например, ‘Z’ – символьная константа.

Управляющие символы используются в строках и записываются в виде десятичного числа, перед которым ставится знак ‘#’. Например,

#7 – символ «звонок»,

#10– символ «перевод строки»,

#13 – символ «возврат каретки».

Комментарии представляют собой фрагмент текста , ограниченный фигурными скобками {} или ограничителями вида (* *). Комментарии выполняют в программе чисто информационную функцию и служат для описания назначения отдельных частей программы, переменных, констант и т. д. Комментарии игнорируются компилятором и не влияют на работу программы.

Особым случаем является комментарий, после открывающейся скобки которого стоит знак доллара $. Такой комментарий называется псевдокомментарием или директивой компилятора. Например, {$N+ } – в программе необходимо использовать математический сопроцессор, {$I-} - отключить автоматическую обработку ошибок ввода-вывода.