Векторный.

В растровом формате изображение запоминается в файле в виде мозаичного набора множества точек, соответствующих пикселам отображения этого изображения на экране дисплея. Файл, создаваемый сканером, в памяти компьютера имеет растровый формат (так называемую битовую карту — bitmap). Редактировать этот файл средствами стандартных текстовых и графических редакторов не представляется возможным, ибо они не работают с мозаичным представлением информации.

В векторном формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т. п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.

Фундаментальное отличие векторных форматов от растровых можно показать на таком примере: в векторном формате окружность идентифицируется радиусом, координатами своего центра, толщиной и типом линии; в растровом формате хранятся просто последовательные ряды точек, геометрически формирующих окружность.

Следует также иметь в виду, что битовая карта требует очень большого объема памяти для своего хранения. Так, битовая карта с одного листа документа формата А4 (204 х 297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайт памяти, она же при воспроизведении 16 оттенков серого — 4 Мбайт, при воспроизведении цветного качественного изображения (стандарт HighColor — 65536 цветов) — 16 Мбайт. Иными словами, при использовании стандарта TrueColor и разрешающей способности 50 точек/мм для хранения даже одной битовой карты может не хватить емкости НМД.

Для сокращения объема памяти, необходимой для хранения битовых карт, используются различные способы сжатия информации. Наиболее распространенный алгоритм растрового уплотнения CCITT Group 4 дает коэффициент сжатия информации до 40:1 (в зависимости от характера данных). Другие используемые форматы сжатия: Group 3, CTIFF (Compressed Tagged Image File Format), MPEG, CALS, RLE, GIF и т. д. (файлы имеют соответствующие указанным аббревиатурам расширения).

Форматы без сжатия: Uncompressed TIFF, BMP и др.

Сканер используется обычно совместно с программами распознавания образов. Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов формат.

Некоторые системы OCR предварительно нужно обучить — ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при распознавании букв, совпадающих по начертанию в разных алфавитах (например, в английском — латиница, в русском — кириллица), и разных гарнитур шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR — FineReader 8.0 — распознает тексты на десятках языков (в том числе языках программирования Basic, C++ и т. д), использует большое число электронных словарей, при распознавании проверяет орфографию, готовит тексты к публикации в Интернете и т. д.

В последние годы появились интеллектуальные программы распознавания образов типа Omnifont (CuneiForm 2000), которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.

Файлы в растровом формате разумно хранить только в том случае, если:

□ документы и соответствующие им файлы не должны редактироваться в процессе их использования;

□ документ должен храниться в виде факсимильных копий оригинала (фотографии, рисунки, документы с резолюциями и т. п.);

□ имеются технические возможности для хранения и просмотра большого числа огромных (по 1-30 Мбайт) файлов.

Основные факторы, учитываемые при выборе сканера:

□ размер, цветность и форма (листовые, сброшюрованные и т. д.) документов, подлежащих сканированию, должны соответствовать возможностям сканера;

□ разрешающая способность сканера должна обеспечивать воспроизведение высококачественных твердых копий документов по их электронным образам;

□ производительность сканера должна быть достаточно высокой при приемлемом качестве получаемого изображения;

□ должна обеспечиваться минимальная погрешность в размерах получаемого электронного изображения по отношению к оригиналу в случае, если размеры изображения с электронного документа служат основанием для производства расчетов;

□ необходимо наличие программных средств сжатия растровых файлов при хранении их в памяти компьютера;

□ необходимо наличие программных средств распознавания образов (OCR) при хранении векторных файлов в памяти компьютера;

□ необходимо наличие программно-аппаратных средств для улучшения качества изображения в растровых файлах (повышения контрастности и яркости изображения, удаления фонового «шума»);

□ качество и тип бумаги носителя в известных пределах не должны сильно влиять на качество получаемого электронного изображения;

□ работа на сканере должна быть удобной и простой и исключать ошибки сканирования при неверной заправке носителя;

□ учитывается стоимость сканера.

Сканер может подключаться к ПК через параллельные (LPT, SCSI) или последовательные (USB 1.1, 2.0) интерфейсы. Для работы со сканером ПК должен иметь специальный драйвер, желательно соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов программами, поддерживающими стандарт TWAIN, например, распространенными графическими редакторами CorelDraw, Adobe Photoshop, MaxMate, Picture Publisher, Photo Finish и т. д.