Единица хранения данных

При хранении данных решаются две проблемы: как сохра­нить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру. При этом образуются адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные тоже имеют размер и тоже под­лежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку частичное заполнение одной единицы хранения приводит к неэффектив­ности хранения.

В качестве единицы хранения данных принят объект пере­менной длины, называемый файлом.

ФАЙЛ — это последовательность произвольного числа бай­тов, обладающая уникальным собственным именем.

Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

Поскольку в определении файла нет ограничений на раз­мер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств ра­боты с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла. Имя файла состоит из двух частей: собственно имени и рас­ширения файла. Например:

Собственно имя файла может состоять из букв русского и ан­глийского алфавитов, цифр и специальных символов. При этом его длина не должна превышать 256 символов.

В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые.

Исполняемые файлы — это такие файлы, которые могут вы­полняться самостоятельно, т. е. не требуют каких-либо специаль­ных программ для их запуска. Имеют следующие расширения:

.ехе — готовый к исполнению файл (tetris.exe; winwordexe);

.com — файл операционной системы (command.com);

.sys — файл операционной системы (Io.sys);

.bat — командный файл операционной системы MS-DOS (autoexec.bat).

Неисполняемые файлы для запуска требуют установки специальных программ. Так, например, для того чтобы про­смотреть текстовый документ, требуется наличие какого-либо текстового редактора. По расширению неисполняемого файла можно судить о типе данных, хранящихся в данном файле. Вот несколько примеров:

РАСШИРЕНИЕ ВИД ФАЙЛА ТИП ДАННЫХ
.txt, .doc, .rtf Текстовый Текст
.bmp, jpeg,-^if, .pcx Графический Изображение
.arj, .таг, .zip Архивный  
.xls Электронная таблица Символы (текст или числа)
.mp3, .wav, .midi Аудиофайл Звук
.avi, .mpeg Видеофайл Изображение