Сравнение DjVu-кодеров

Сравнение DjVu-кодеров

Целью тестирования является сравнение бесплатных djvu-кодеров:

Выбор исходных документов

Большинство книг содержит только черно-белый текст и иллюстрации, поэтому такое ограничение вполне оправдано. Если PDF документ не мог быть корректно преобразован в DjVu хотя бы одним из… В тестировании участвовали два типа документов: отсканированные и "чистые", сделанные непосредственно из…

Параметры используемого ПО

В пакете DjVuLibre за сжатие черно-белых изображений отвечает программа cjb2. При запуске без ключей осуществляется сжатие без потерь. Ключ -clean… Сервер Any2DjVu использует аналогичные способ работы, только входных форматов… DjVu Solo работал в паре с Adobe Acrobat 5.0. Полученные в Acrobat изображения открывались в Solo и сохранялись в…

Полученные результаты

  Текстовые книги (размер в Кб) PDF cjb2 cjb2 -clean cjb2 -loose cjb2 -clean…     *Книги с диска РХД содержат изображения, полученные из текстовых оригиналов, поэтому их объем…

Выводы

Для отсканированых книг компрессор cjb2 из состава DjVuLibre уменьшает объем PDF приблизительно в 2 раза без потерь качества. Опции сохранения с потерями существенного увеличения в степени сжатия не дают. В целом cjb2 уступает в два раза DjVu Solo и Any2DjVu. Что интересно, этот разрыв сохраняется и на "чистых" изображениях, на которых сжатия с потерями, реализованное в DjVu Solo и Any2DjVu, не должно было бы принести значительное преимущество. Использование cjb2 может быть оправдано в случае, если требуется пакетная обработка множества документов, содержащих "чистое" изображение без текстового оригинала.

Коэффициент сжатия для всех отсканированных книг: Any2DjVu 109340 / 26751 = 4,09; DjVu Solo 109340 / 22480 = 4,86. Степень сжатия DjVu Solo больше, но нужно учитывать, что это сжатие с потерями и полученные документы не идентичны. Хотя оба выглядят весьма качественно. На мой субъективный взгляд на Any2DjVu изображения получаются более четкими.

Для "чистых" изображений, полученных непосредственно из текста коэффициент сжатия значительно меньше и перевод их в DjVu вряд ли имеет смысл. При таком переводе текст будет преобразован к изображению, хотя и возможно добавление отдельного текстового слоя. Совершенно другие результаты будут в случае, если у вас нет оригинального текста, а есть только его изображение. В этом случает достигается коэффициент сжатия 31735 / 1595 = 19,9. При сохранении в DjVu Solo "чистых" черно-белых изображений опции Bitonal и Clean дают одинаковые результаты.