Программы автоматического распознавания текста

Автоматизация ввода информации в компьютер

Сканирование – технологический процесс, в результате которого создается графический образ бумажного документа. Минимальный элемент изображения интерпретируется сканером как цветная (или серая) точка и в файле хранится растровое изображение исходного документа, количество точек определяется размером изображения и разрешением сканера.

Автоматическое распознавание текста

Отсканированное изображение документа не является текстовым, а лишь набором разноцветных точек. Распознавание текста производится с помощью специальных программных средств – средств распознавания образов.

Программы распознавания текстов должны выполнять следующие операции:

  1. Сканирование.
  2. Сегментация.
  3. Распознавание.
  4. Проверка орфографии.
  5. Сохранение.

Наиболее широко известными и распространенными являются программы Fine Reader (АВВУУ) и Cunei Form (Coginitive). Fine Reader обеспечивает высокое качество распознавания и удобство применения, позволяет объединять сканирование и распознавание в одну операцию.

Существуют различные версии Fine Reader :

ü Простая модификация поставляется со сканером.

ü Профессиональная Fine Reader Pro может грамотно обработать таблицы и изображения, читать штрих-коды, добавлять в базу данных новые языки.

ü Самая мощная и дорогая Fine Reader Corporate может распознавать любые бланки и формы.

Fine Reader поддерживает почти 200 языков распознавания (в том числе экзотические, древние и некоторые языки программирования).

Программа Cunei Form содержит гораздо меньше функциональных возможностей и поддерживает всего 20 языков, и предлагает только полезные и необходимые услуги.