Сканеры

Сканер — устройство для считывания текстовой или графической (рисунок, фотография) информации с оригинала и ввода ее в компьютер. Сканеры переносят информацию с бумажных документов в память компьютера, т. е. создают оцифрованное изображение. Принцип действия сканера следующий: световой поток, создающийся лампой холодного свечения, отражается от оригинала и считывается датчиком. Затем считанная и оцифрованная информация посылается в компьютер.

Основные характеристики сканеров определяются разрешением, с которым возможна оцифровка оригинала, и глубиной воспринимаемого цвета. Стандартным разрешением для офисного сканера можно считать 300 — 600 точек на дюйм. Это так называемое оптическое разрешение, т.е. разрешение, которое способен дать непосредственно датчик сканера. Глубина цвета определяется битностью информации о цвете в одной точке. Если в характеристике сканера сказано, что глубина его цветопередачи 32 бит, это означает следующее: в одной точке хранится информация о 16,7 млн цветов. Оптическое разрешение определяется датчиком сканера и числом отдельных элементов в нем. Например, у сканеpa, обладающего разрешением 600 х 1200 точка/дюйм, датчик имеет 600 элементов на дюйм. Но датчик в каждый момент времени считывает только одну линию точек. Вторая цифра в обозначении — это механическое разрешение сканера, число шагов, совершаемое шаговым двигателем при перемещении датчика вдоль планшета. Таким образом, данный сканер обладает оптическим разрешением 600 точка/дюйм и механическим — 1200 точка/дюйм. Оптическое разрешение сканера определяется по меньшему числу, а большее число может быть использовано при отсутствии эмпирических результатов для определения вероятности того, что сканер обеспечивает обещанное оптическое разрешение. При печати оптимальный результат будет получен тогда, когда число пикселов на дюйм изображения соответствует числу точек на дюйм принтера.

После оцифровки текста он представляется в виде изображения, и необходимо провести его распознавание. Для этого применяются несколько программ распознавания оптических образов. Пакет распознавания — специальная компьютерная программа, позволяющая перевести отсканированное графическое изображение текста в текстовый формат.

Принципы распознавания, заложенные в различные пакеты, сходны. Программа анализирует графический образ символа и выдвигает ряд гипотез, в соответствии с которыми этому образу присваивается соответствующий текстовый эквивалент. Как правило, пакет распознавания универсален и работает с разными шрифтами и стилями начертания символов, хотя некоторые программы позволяют настроиться на конкретный шрифт и даже обучаются неизвестным символам. Отдельные пакеты позволяют учитывать дефекты начертания символов и содержат модули лингвистической поддержки, анализирующие не только каждый символ, но и слово в целом, контекст предложения и всего текста.

За рубежом наиболее известны пакеты Omni Page, Read Iris, Text Bridge, Word Links. Практически все сканеры, продаваемые в Европе, включают в комплект облегченную версию одного из этих пакетов. Все эти пакеты достаточно достоверно распознают латинские тексты и, как правило, содержат несколько языковых модулей. Стандартный набор — английский, немецкий, французский. Некоторые пакеты включают 10—15 языковых модулей, а Read Iris, к примеру, содержит даже русский модуль. Сканеры Microtek в настоящее время поставляются в Россию с пакетом распознавания Omni Page LE, ориентированном на Windows 95 и Macintosh. В России наиболее известны такие пакеты, как Fine Reader, CuneiForm, Author.

Отечественные пакеты ориентированы прежде всего на распознавание кириллицы, хотя в состоянии работать с латинскими и смешанными текстами. Таким образом, при работе с текстом будет осуществляться следующая последовательность действий: помещение оригинала на стекло сканера, запуск программы сканирования, получение изображения, распознавание текста из изображения, помещение распознанного текста в текстовый редактор и его редактирование, если это необходимо.

При необходимости отсканировать рисунок изображение помещают на стекло сканера, сканируют и записывают в графическом файле или обрабатывают в графическом редакторе.

При отсутствии факсового аппарата, но при наличии факс-модемной платы в компьютере возможна посылка факсовых сообщений, используя возможности сканера как считывающего устройства.

Существуют ручные сканеры, которые прокатывают по поверхности документа рукой, и планшетные сканеры, по внешнему виду напоминающие копировальные машины.

Практически весь ассортимент современных сканеров относится к одному конструктивному типу — планшетным сканерам. Вне зависимости от фирмы-производителя, интерфейса, габаритных размеров и технологии сканирования они имеют в конструкции плоское горизонтально расположенное стекло — планшет. На этом стекле располагают подлежащую оцифровке страницу или фотографию; под ним, внутри корпуса, перемещается считывающий элемент (каретка). Перемещая каретку под лежащим на стекле оригиналом, любой сканер прежде всего освещает подлежащую обработке область. Для этого на каретке смонтирован источник света, в большинстве случаев это яркая лампа. Световой поток падает на оригинал, отражается и попадает на ту же каретку, но теперь изменения его яркости и спектрального состава уже несут информацию о той области, от которой произошло отражение. Эта информация собирается при помощи оптической системы сканера и преобразуется в электрические сигналы оптико-электронным преобразователем.

Различаются CIS- и CCD-технологии. Оптическая система CIS-сканера устроена намного проще и состоит из одного лишь оптико-электронного преобразователя, располагающегося непосредственно под планшетным стеклом. Длина светочувствительной линейки такого преобразователя CIS (Contact Image Sensor) соответствует ширине планшета сканера, поэтому дополнительные элементы, фокусирующие или перенаправляющие световой поток (зеркала, призмы, линзы), не нужны. CIS-сканер заметно компактнее сканера, реализующего технологию CCD за счет технологии, позволяющей обойтись без зеркал и объектива. В некоторых случаях конструкция CIS-сканера не содержит даже традиционной лампы, вместо которой используются полупроводниковые излучатели (светодиодные линейки). Модели с полупроводниковым осветителем отличаются низкой потребляемой мощностью и менее чувствительны к механическим воздействиям.

Оптическая система CCD-сканера заметно сложнее. Прежде чем попасть на оптико-электронный преобразователь, световой поток проходит через две-три линзы, отражается несколькими зеркалами. С выхода оптико-электронного преобразователя (ОЭП) сигнал поступает на вход аналого-цифрового преобразователя. Сигнал имеет теперь вид непериодической последовательности электрических импульсов и может быть обработан различными электронными каскадами. Основное требование, предъявляемое к оптико-электронному преобразователю, — максимально точное «превращение» светового потока в поток электронный.

Планшетный сканер — аппарат, конструкция которого подразумевает размещение оригиналов на горизонтальном стекле. Помимо планшетных различают ручные, листовые или протяжные, барабанные, проекционные и слайд-сканеры. Ручные и листовые сканеры сейчас практически не встречаются.