Файл формата djvu

Чем открыть файл DjVu: онлайн, на компьютере и на смартфоне

Файл формата djvu

Если вы зашли сюда, то наверняка столкнулись с файлом непривычного формата DjVu. Программы, предустановленные в вашей системе, опознать его не могут, но выход есть. Рассмотрим основные способы открытия DjVu-файлов.

Что такое DjVu

Формат DjVu (дежа вю) создан для сохранения отсканированных книг и журналов. Его ключевая особенность — высокая степень сжатия готового документа. Если оригинал в формате PDF весит 25 мегабайт, то конвертация в DjVu способна уменьшить его до 50 килобайт. Даже сейчас для кого-то это критически важно, ведь не у каждого есть доступ к скоростному безлимитному интернету.

Сервисы для просмотра DjVu онлайн

В сети есть ресурсы, которые позволяют просматривать файлы DjVu без программ. Это  отличный вариант, если у вас на компьютере нет ничего подходящего, но есть доступ в Интернет. Использовать их просто – заходим, загружаем файл, выбираем качество отображения содержимого и читаем.

Рассмотрим несколько самых удобных сервисов.

Ofoct

С помощью англоязычного ресурса ofoct.com можно просматривать файлы разных форматов – не только DjVu, но и других: PSD, ePub, VSD. Возможностей у него много:

  • масштабный аудиоконвертер;
  • видеоконвертер;
  • конвертер офисных документов;
  • 3D-моделей.

Не обращайте внимания на англоязычность: все действия по просмотру и конвертации файлов выполняются очень просто — всего в несколько кликов. Нажимаете на кнопку Upload, загружаете нужный файл и читаете.

Кстати, обратите внимание на вспомогательные кнопки, позволяющие увеличить масштаб или перейти на другую страницу.

RollMyFile

Бесплатный англоязычный облачный сервис, который открывает больше 500 форматов файлов. При загрузке запускается многофункциональная и удобная читалка. Она имеет следующие функции:

  • поиск по тексту;
  • изменение масштаба;
  • добавление примечаний;
  • создание закладок;
  • переход на необходимую страницу.

Все то же самое, что и у профессиональных программ для чтения DjVu, но в данном случае – в режиме онлайн. Для чтения нажимаем кнопку Choose и загружаем файл.

Fviewer

Fviewer – еще один онлайн-просмотрщик различных текстовых документов. Этот сервис, скорее всего, понравится тем, кто не понимает английский. В нем есть поддержка русского языка – если нужно, выберите его в верхнем правом углу страницы. В остальном он не имеет особых отличий от своих собратьев: жмем на кнопку, загружаем файл и читаем.

Кстати, разработчики Fviewer реализовали поддержку API для интеграции функционала сервиса с вашим сайтом.

Заметим также, что для чтения книг в формате djvu можно и не заходить на сайты различных сервисов. Существуют расширения, которые позволяют читать этот формат прямо в веб-браузерах. Пример такого инструмента для Google Chrome – DjVu Viewer and Reader. Он начинает работать сразу после установки в браузер и не нуждается в каких-либо настройках.

Читалки DjVu для Windows и Mac

Когда на компьютере есть программы с поддержкой  DjVu, любой файл такого формата будет открываться в них по умолчанию. Принцип использования такого ПО везде одинаков: нажимаем кнопку «Файл» и выбираем «Открыть».

WinDjView

WinDjView – пожалуй, самый удобный просмотрщик файлов в формате DjVu. Одна из его версий – портативная, запускается с любого внешнего носителя. Он не перегружен функциями, но для удобного чтения книг здесь есть всё:

  • настройка яркости;
  • создание закладок;
  • повороты, масштабирование;
  • поддержка печати.

Читалка WinDjView полностью на русском языке, ее использование бесплатно и интуитивно понятно. На панели инструментов размещены элементы навигации, с помощью которых происходит управление просмотром. Слева расположены миниатюры страниц – можно выбрать любую, прочесть, отправить на печать или экспортировать в файл графического формата.

Стандартные функции программы – масштабирование и изменение ориентации страницы. Есть возможность переноса выделенной области книги в другой файл. Чтобы это сделать, отметьте нужный фрагмент, скопируете его в буфер обмена и вставьте в документ или графический редактор.

WinDjView – программа быстрая и удобная, она отлично работает на всех версиях Windows.

Если вы – обладатель устройства с операционной системой Mac OS X, то для вас разработан специальный релиз этой программы — MacDjView, По функционалу он полностью идентичен WinDjView.

DjVu Reader

Второй участник рейтинга – старейшее бесплатное приложение, набравшее свою популярность еще в начале нулевых. Хоть оно и не обновляется с 2005 года, но отлично работает на Windows 10.

Ключевые возможности DjVu Reader:

  • выбор между однооконным и двухоконным режимами;
  • копирование выделенного текста в буфер обмена;
  • поиск по тексту;
  • полноэкранный режим просмотра.

Устанавливать программу не надо – она запускается прямо из папки. Кстати, изначально она была создана только на английском языке, но позже появилась русифицированная версия.

STDU Viewer

Просмотрщик STDU Viewer отлично справляющийся с обработкой разных форматов электронных книг. Версия для личного использования бесплатна.

Приложение имеет классический набор функций: поиск по документу, масштабирование, копирование данных в буфер обмена, создание закладок. Весь документ или отдельные страницы можно послать в печать.

Есть у него и нестандартная возможность — умение делать скриншоты выбранных областей.

На официальном сайте представлены обычная и портативная версии программы. Кстати,  ее ключевая особенность – небольшой размер. Он составляет всего 2,2 мегабайта. По сравнению с другими приложениями разница ощутимая.

Помимо прочего, STDU Viewer – еще и конвертер форматов. Чтобы воспользоваться функцией конвертации, заходим в меню «Файл», выбираем в контекстном меню кнопку «Экспортировать», а затем сохраняем страницу как изображение.

STDU Viewer отлично работает на всех версиях Windows.

DjVuLibre

DjVuLibre — полноценный редактор для работы с форматом DjVu. У него весьма внушительный список возможностей: изменения в тексте, конвертация документов в файлы другого формата, сохранение слоев.

Изначально утилита была создана для Linux, позже появились версии для Windows, но просуществовали недолго. Программа не адаптирована для работы с последними версиями винды и стабильно работает максимум на «семерке». Зато она абсолютно бесплатна и имеет в интерфейсе русский язык.

Работа с DjVuLibre не представляет особой сложности даже для неопытного пользователя, все требуемые кнопки расположены на панели управления. Отличительная особенность программы – отличная скорость загрузки файлов и работы с ними.

Sumatra PDF

Эта бесплатная читалка представляет собой многофункциональный комбайн для работы с документами разных форматов. Программа прекрасно воспроизводит не только DjVu, но и HTML, TXT, RTF, DOC. Если вы много читаете, возможно, именно она станет вашим ежедневным помощником.

Из дополнительных функций Sumatra PDF:

  • печать документа;
  • копирование текста;
  • поддержка горячих клавиш.

Интерфейс программы прост, имеется русский язык. Книги одного автора автоматически объединяются в группы в библиотеке.

Ридеры для Android и iOS

Современные пользователи читают не только на компьютере или ноутбуке, но и на мобильном устройстве, однако стандартными средствами на смартфоне файл формата DjVu не откроешь. Проблему легко решить – достаточно установить на мобильный гаджет одно из перечисленных ниже приложений.

EBookDroid

Читалка для Android с поддержкой большого числа форматов. По мнению пользователей Google Play, эта программа занимает лидирующее положение среди просмотрщиков DjVu. У нее есть одно интересное свойство – индивидуальная настройка и запоминание параметров для каждой книги.

Из прочих возможностей EBookDroid стоит отметить следующие:

  • сортировка литературы по автору и жанру;
  • создание заметок и аннотаций;
  • возможность делать рисованные примечания.

Если при прочтении книги у вас появилась какая-нибудь мысль, вы сможете ее не только записать, но и зарисовать.

EBookDroid позволяет скачивать литературу из онлайновых библиотек. Функционирует быстро и стабильно. Имеет поддержку русского языка, не требует оплаты.

AnDoc

AnDoc — просмотрщик с обширным числом настроек для комфортного чтения файлов в формате DjVu. В настройках приложения можно выставить русский язык, включить последний открытый документ, отрегулировать гамму и контрастность. Несложно подвести все настройки под себя и читать так, как нравится. Единственный недостаток – нельзя адаптировать текст под размер экрана.

Обилие настроек особенно помогает при чтении книг DjVu, которые не очень качественно отсканированы. Регулировка гаммы и экспозиции позволяет сделать текст более читабельным.

Работает AnDoc быстро и стабильно, кнопки навигации расположены удобно. Распространяется бесплатно.

PocketBook

PocketBook — еще одно интересное приложение для Android. Каждый запуск эта программа проверяет, не появились ли на устройстве новые книги, что экономит время при поиске.

В ней присутствует масса возможностей для комфорта пользователя:

  • выбор режима чтения – есть одностраничный, двустраничный, в форме свитка;
  • настраиваются цвет, яркость шрифты и фоны;
  • можно делать текстовые заметки.

Кроме того, в PocketBook можно делать скриншоты, включать ое чтение, масштабировать текст с учетом своих запросов. Отдельно отметим запоминающийся дизайн – круговую систему навигации, которая многим покажется необычной и очень удобной. Программа бесплатна.

eReader Prestigio

eReader Prestigio — читалка для разных электронных книг, которая успешно распознает файлы формата DjVu. Среди ее основных особенностей:

  • приятный дизайн, среди всех мобильных программ для чтения книг именно эта кажется самой красивой;
  • традиционная для профессиональных просмотрщиков возможность сортировать литературу по жанру, автору, частоте открытия;
  • все кнопки управления собраны в боковом меню, из которого можно быстро получить доступ к параметрам отображения;
  • есть встроенный файловый менеджер.

Русскоязычный интерфейс, бесплатность, быстрая и стабильная работа – производитель телефонов и планшетов Prestigio не зря устанавливает эту программу на многие свои гаджеты.

iBouquiniste Lite

Последним участником сегодняшнего обзора стал интересный инструмент для воспроизведения файлов DjVu на iOS. iBouquiniste Lite – это компактное приложение с минимальным функционалом, однако достаточным для комфортного чтения.

Возможности iBouquiniste Lite:

  • Сортировка и систематизация литературы.
  • Печать документов.
  • Поиск по словам или словосочетаниям в загруженных электронных книгах.

***

Какую читалку выбрать? Все зависит от ваших предпочтений. Каждое из представленных приложений отлично справляется с возложенными на него задачами. Теперь, надеемся, проблем с чтением файлов DjVu у вас не возникнет.

Источник: https://CompConfig.ru/software/chem-otkryt-fajl-djvu.html

DjVu: Что такое файлы DjVu и как их быстро открыть

Файл формата djvu

Формат файла DjVu обычно использует расширение .djvu. Он был разработан как альтернатива формату Adobe PDF в 1996 году. Благодаря усовершенствованным алгоритмам сжатия DjVu оптимизирован для отсканированных документов, которые содержат как изображения, так и текст.

В большинстве случаев файлы DjVu более компактны, чем сопоставимые PDF-файлы.Это был короткий ответ на ваш вопрос. Однако, скорее всего, вы попали на эту страницу, так как недавно встретили файл DjVu и задались вопросом, как его открыть.

Поэтому первая часть этой статьи предоставит вам все инструменты и алгоритмы для открытия файла DjVu.

Но если Вы также хотите иметь более глубокое понимание о DjVu, Вы попали в правильное место: Вторая часть этой статьи предоставит вам историческую и техническую справочную информацию об этом интересном формате файла, поэтому оставайтесь с нами!

Расширения имени файла

Тип интернет-медиа

Разработан

Первоначальный выпуск

Последний выпуск

Технические характеристики DjVu
.djvu, .djv
image/vnd.djvu, image/x-djvu
AT&T Labs – Research
1998; 19 years ago (1998)
Version 26(Июнь 2006; 11 лет назад (2006-06))
GNU GPLv2

В принципе существует два способа доступа к файлу DjVu. Если вы ищете быстрое и «грязное» решение, вы можете преобразовать его в PDF и открыть с помощью своего любимого средства просмотра PDF, такого как Acrobat reader:

  • 1. Для преобразования любого файла DjVu в PDF вы можете напрямую использовать наш конвертер DjVu в PDF.
  • 2. Если вы предпочитаете устанавливать программное обеспечение для прямого просмотра DjVu, с другой стороны, вас может заинтересовать наш обновленный список читалок DjVu.

Для преобразования DjVu мы рекомендуем использовать онлайн-конвертер. Установка офлайнового конвертера не стоит усилий, поскольку вы можете напрямую переключиться на читалку DjVu, что позволит вам пользоваться всеми преимуществами DjVu. На самом деле, есть несколько веских причин, чтобы выбрать второй вариант. Может быть, остальная часть статьи Вас в этом убедит.

Лучшие читалки DjVu

Преобразование всегда сопровождается качественными потерями, если вы, конечно, не готовы мириться с выходными файлами большими, чем исходный документ.

Поскольку документы DjVu довольно похожи на PDF-файлы и даже доступны для поиска во многих случаях (что часто забывается), и, возможно, придерживаться оригинального документа, выбирая подходящую читалку, будет хорошим выбором.

Существует целый ряд программ для чтения DjVu для почти всех операционных систем, доступных в Интернете, небольшая часть из которых представлена здесь вкратце:

Sumatra Reader является одним из наименее известных программ для чтения DjVu, которые доступны для Windows.

По сравнению с другими альтернативами, представленными здесь, она не только позволяет открывать и просматривать DjVu-файлы, но также поддерживает основные операции для их обработки и редактирования.

Поэтому, вероятно, это лучший выбор для работы с DjVu на Windows.

Ссылки для скачивания:

DjView

DjView – хорошая читалка DjVu, которая доступна бесплатно для операционных систем Windows, Linux и Mac. Она позволяет искать в документах DjVu, может показать схему документа и уменьшенные изображения конкретных страниц.

Ссылки для скачивания:

Windows Macintosh Linux

WinDjView, MacDjView

Еще один полезный инструмент, который предлагает примерно такую же функциональность, как и DjView.

Кроме того, он позволяет выделить и скопировать текст с помощью курсора, что очень похоже на работу с PDF-документом. Также пользовательский интерфейс очень похож на большинство программ для PDF.

Названия уже подразумевают, что программное обеспечение доступно для Windows и MacOs.

Ссылки для скачивания:

Windows & Macintosh

X Djvu для iPhone и iPad

Да, вы можете читать документы DjVu с помощью своего iPhone! X Djvu – полезное приложение, которое позволяет вам читать документы DjVu с помощью iPhone или iPad и предлагает множество различных функций. Уменьшенную версию X Djvu Lite можно бесплатно загрузить для тестирования.

Ссылки для скачивания:

Mac OS

Ebookdroid – средство для чтения документов для Android

Вы хотите прочитать ваши документы DjVu на своем смартфоне с ОС Android. Нет проблем! Доступно множество бесплатных читалок документов, которые позволяют открывать DjVu-файлы на Android. Хорошим является, например, Ebookdroid, который также поддерживает PDF. Установка очень проста через Google App Store.

Ссылка для скачивания:

Android

Откуда появился формат файла DjVu?

Формат DjVu был разработан как альтернатива формату PDF в 1998 году в AT&T Labs, где были сделаны некоторые новаторские изобретения, такие как транзистор. Основными вкладчиками в развитие DjVu были Ян ЛеКун, Леон Ботту, Патрик Хэффнер и Пол Г.

Говард, а ведущей идеей развития DjVu было создание формата файла, который был бы оптимизирован для отсканированных документов, которые содержат как изображения, так и текст. Ключевым требованием была улучшенная работа, чем в PDF для такого рода документов.

Ключевым преимуществом DjVu является ограниченный размер файлов DjVu. Поэтому он часто используется для распространения отсканированных документов в Интернете.

В отличие от PDF, это формат открытого файла, который означает, что он может быть использован как с открытым исходным кодом, так и с авторским программным обеспечением. Формат DjVu обычно использует расширение .djvu или иногда просто .djv.

Почему файлы DjVu особенные?

Файлы DjVu используют передовые технологии сжатия, которые примерно в 5-10 раз лучше, чем файлы JPEG и Tiff. Отсканированная страница в цвете (разрешение 300 DPI) с размером файла, скажем, около 25 МБ, может быть легко сжата до 100 кбайт (!) с использованием DjVu. Все DjVu-файлы могут быть оснащены текстовым слоем, что сделает их доступными для поиска по документу.

Эти поисковые DjVu-файлы очень похожи на документы PDF.Ключом к достижению этого превосходного сжатия является так называемая многомасштабная двухцветная кластеризация, которая позволяет разделять маски переднего и заднего фона, что является более общим, чем стандартная сегментация текста/изображения.

Наряду с набором алгоритмов сопоставления мягких шаблонов сжатие JBIG2, которое используется в DjVu, превосходит сжатие JBIG1 в два раза, что было стандартом для двухуровневых изображений в течение длительного времени.

Принцип кодирования JBIG2 заключается в следующем: во-первых, метод идентифицирует почти идентичные формы на странице, такие как множественные совпадения определенного символа в заданном шрифте, стиль и размер. Затем он сжимает растровое изображение каждой уникальной формы отдельно и затем кодирует места, где каждая форма появляется на странице.

Подобно этому, похожие формы сжаты только один раз, а не несколько, что объясняет преимущество с точки зрения размера файла, что обычно показывают файлы DjVu.Другими ключевыми компонентами техники сжатия, используемой DjVu, являются многомасштабный алгоритм последовательных проекций и так называемый ZP-кодер.

Файлы DjVu со скрытыми слоями OCR

Можно думать о файлах DjVu как о свободной коллекции растровых изображений, которые не содержат текстовой информации, доступной для поиска, и поэтому ее трудно обрабатывать.

Итак, нам нужно привыкнуть к тому, что PDF – это бесспорно более красивый формат? Конечно нет! Авторы DjVu были достаточно умны, чтобы сделать отличную работу: для того, чтобы сделать файлы DjVu доступными для поиска, и быть похожими на файлы PDF, они добавили скрытый уровень OCR к определению формата файла.

Это очень экономичный способ предоставления текстовой информации с возможностью поиска, с одной стороны, и строгое разделение между визуальным внешним видом документа и содержимым, которое может быть просмотрено читателем. Большинство файлов DjVu, которые распространяются в Интернете, содержат такой текстовый слой.

Основное различие между DjVu и PDF заключается в том, что формат DjVu представляет собой формат растрового изображения, тогда как формат PDF является масштабируемым векторным форматом. Этот трюк позволяет даже легко копировать и вставлять текст из любого DjVu, который оснащен таким слоем, как тот, который используется для работы с PDF-файлами.

Лицензирование и адаптация DjVuDjVu появился сначала как воплощение с открытым исходным кодом, которое было названо «DjVuLibre» и использовало GNU General Public License.

Тем не менее, права на копирование коммерческих разработок программного обеспечения для кодирования были переданы нескольким различным компаниям на протяжении многих лет, включая AT&T Corporation, LizardTech, Celartem и другие.

Хотя PDF используется чаще, чем DjVu, несмотря на то, что некоторые эксперты считают, что DjVu на самом деле является лучшим форматом документов из-за превосходных алгоритмов сжатия, DjVu достигла значительного уровня принятия из-за этого лицензирования с открытым исходным кодом. Поскольку DjVu был разработан на пике эпохи оцифровки, когда многие книги были отсканированы, до сих многие используют DjVu для сканирования документов и книг и распространение их через Интернет. Кроме того, в 2002 году Интернет-архив, который предоставляет миллионы сканированных книг с публичным доменом, также решил поддержать DjVu вместе с PDF.

Технические характеристики файлов DjVu

DjVu был первоначально получен из формата файлов обмена (IFF), который основан на иерархически организованных фрагментах. Как и в случае с IFF, его структуре предшествует 4-байтное магическое число AT&T.

За этим идентификатором следует маркер, указывающий, нужно ли делать одностраничный (DJVU) или многостраничный документ (DJVM), соответственно. Более подробный обзор, несомненно, выходит за рамки этой статьи. Другая важная спецификация – это интернет-mime-тип для DjVu – image/vnd.

djvu or image/x-djvu. Текущая версия DjVu – 26 версия, выпущенная более 10 лет назад.

Будущее DjVu

Несмотря на то, что за последние годы в развитии DjVu не было достигнуто большого прогресса, количество выпущенных DjVu-файлов в конечном итоге снова увеличивается. Это может быть связано с самым убедительным преимуществом DjVu, а именно с их невероятно компактным размером.

В те времена, когда всемирная сеть все больше и больше используется мобильными устройствами, а пропускная способность по-прежнему является фактором стоимости, использование превосходного сжатия DjVu, может помочь сэкономить время и деньги.

Между тем существуют также приложения, которые могут использоваться для отображения DjVu-файлов на смартфонах и планшетах. Конечно, это чистая спекуляция, но, возможно, будущее DjVu может быть более ярким, чем его прошлое.

На самом деле имя DjVu реализует какое-то скрытое сообщение, так как его вдохновляет французское выражение DjVu [дежавю], что означает нечто вроде «уже увиденного». Поскольку вы теперь знакомы с DjVu, вы можете быть абсолютно уверены, что увидите его снова очень скоро в мире Интернета.

Источник: https://www.djvu-pdf.com/ru/djvu-format/

Программы для открытия файлов DJVU — чем открыть DJVU?

Файл формата djvu

  1. DjVuReader
  2. WinDjView
  3. STDU Viewer
  4. Universal Viewer
  5. DjView

Редкие и старые издания книг часто можно загрузить только в электронном формате DJVU. Чтобы открыть файл для чтения, нужно воспользоваться специальными программами для Windows, которые дают возможность просматривать и редактировать содержимое электронных документов.

DjVuReader

DjVuReader — самое популярное приложение для просмотра документов и файлов в формате DJVU. В программе доступна возможность настройки режима чтения (одно- и двухстраничный просмотр) и быстрый переход между главами. Также есть возможность регулирования яркости и контрастности, функция копирования текста и графических изображений в буфер обмена.

Читалка полностью бесплатная, совместима с Windows (32/64 бит) и переведена на русский язык.

В верхней части интерфейса программы находится панель инструментов. Здесь можно выбрать режим отображения цветов электронной книги (цветной, маска, фоновый, передний план).

Следующий инструмент — настройка режима чтения:

  • одна страница — текст отображается на одной странице;
  • режим альбома — текст отображается на двух страницах;
  • режим книги — классический форма чтения электронного документа в формате книги;
  • режим буклета — электронный файл отображается в формате буклета.

Следующие элементы панели инструментов — копирование содержимого электронной книги формата DJVU — текст и графические изображения — в буфер обмена. Можно выделить нужную область для копирования.

Далее расположены инструменты навигации: переход между страницами, быстрый переход на последнюю страницу электронной книги. Доступен инструмент для перехода на нужную страницу по номеру, где также можно настроить масштаб отображения.

Преимущества программы DjVuReader:

  • бесплатная модель распространения;
  • простой и удобный интерфейс с поддержкой русского языка;
  • инструмент для быстрого перехода между страницами и главами;
  • возможность копирования содержимого электронных книг в буфер обмена;
  • несколько режимов чтения;
  • настройка режима цвета.

Недостатки:

  • нельзя конвертировать файл из одного формата в другой.

Universal Viewer

Universal Viewer — приложение для просмотра электронных документов и графических изображений. В программе доступно 9 режимов отображения файлов, есть функция печати страниц книги и возможность просмотра содержимого электронных документов в полноэкранном режиме. Также в утилите можно установить дополнительные плагины для расширения базового функционала ПО.

Читалка бесплатная, совместима с Windows (32/64 бит) и переведена на русский язык.

В главном окне приложения находится панель инструментов для управления электронными документами. Доступна функция быстрого переключения между несколькими текстовыми или графическими файлами.

Есть функция для быстрого поиска содержимого по тексту. Чтобы начать поиск нужно ввести фразу или предложение в строку “Find” и нажать кнопку “Найти”.

Поддерживается возможность быстрой навигации по страницам. Для этого необходимо указать нужный номер страницы в строке “Page” или воспользоваться функциями:

  • “Previous Page” — для перехода на предыдущую страницу;
  • “Next Page” — переход на следующую страницу электронного документа.

Доступны инструменты для смены масштаба отображения: увеличение и уменьшение. Можно включить функцию исходного размера: содержимое страниц документа DJVU будет отображаться в оригинальном размере. Поддерживается возможность просмотра контента в полноэкранном режиме.

В разделе меню “Режим” можно выбрать режим отображения содержимого электронного документа: текст, двоичный или шестнадцатеричный код, графика/мультимедиа, интернет, плагины. Каждый из режимов используется для просмотра контента разных форматов и расширений.

Преимущества:

  • простой интерфейс на русском языке;
  • бесплатная модель распространения;
  • несколько режимов чтения электронных книг;
  • возможность установки дополнительных плагинов;
  • быстрая навигация по тексту;
  • инструмент для печати файлов.

Недостатки:

  • нет встроенного конвертера файлов.

Электронные книги и их форматы: DjVu — его история, плюсы, минусы и особенности

Файл формата djvu
В начале 70-х годов американский писатель Майкл Харт (Michael Hart) сумел получить неограниченный доступ к компьютеру Xerox Sigma 5, установленному в университете штата Иллинойс. Чтобы достойно использовать ресурсы машины, он решил создать первую электронную книгу, перепечатав Декларацию независимости США.

Сегодня цифровая литература получила широкое распространение, во многом благодаря развитию портативных устройств (смартфонов, ридеров, ноутбуков). Это привело к появлению большого количества форматов электронных книг. Попробуем разобраться в их особенностях и расскажем историю наиболее популярных из них — начнем с формата DjVu.

/ Flickr / Lane Pearman / CC DjVu был разработан в 1996 году компанией AT&T Labs с одной целью — дать веб-разработчикам инструмент для распространения изображений в высоком разрешении через интернет.

Дело в том, что в то время 90% всей информации все еще хранилось на бумаге, а многие из важных документов имели цветные изображения и фотографии.

Чтобы сохранить читаемость текста и качество картинок, приходилось делать сканы в высоком разрешении.

Классические веб-форматы — JPEG, GIF и PNG — позволяли работать с такими изображениями, но ценой объема. В случае JPEG, чтобы текст был читаем на экране монитора, приходилось сканировать документ с разрешением 300 dpi. Цветная страница журнала при этом занимала порядка 500 Кбайт. Скачивание файлов такого объема из интернета в то время было довольно трудоемким процессом.

Альтернативой было оцифровывание бумажных документов с помощью технологий распознавания текста, однако 20 лет назад их точность была далека от идеальной — после обработки финальный результат приходилось серьезно править вручную. При этом графики и изображения оставались «за бортом». И даже если удавалось встроить отсканированную картинку в текстовый документ, терялись некоторые визуальные детали, например, цвет бумаги, её текстура, а это важные компоненты исторических документов. С целью решить эти проблемы AT&T и разработали DjVu. Он позволил сжимать отсканированные цветные документы с разрешением 300 dpi до 40–60 Кбайт, при размере оригинала в 25 Мбайт. Размеры чёрно-белых страниц DjVu уменьшил до 10–30 Кбайт.
DjVu может работать как с бумажными отсканированными документами, так и с другими цифровыми форматами, например PDF. В основе работы DjVu лежит технология, разбивающая изображение на три компонента: передний план, задний план и чёрно-белую (битовую) маску.

Маска сохраняется с разрешением исходного файла и содержит изображение текста и прочие чёткие детали — тонкие линии и схемы — а также контрастные картинки.

Она имеет разрешение 300 dpi, чтобы тонкие линии и контуры букв оставались четкими, и сжимается с помощью алгоритма JB2, который представляет собой вариацию алгоритма JBIG2, предложенного AT&T для работы факсов.

Особенностью JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз.

Таким образом, в многостраничных документах каждые несколько последовательных страниц пользуются общим «словарём».

Задний план содержит текстуру страницы и иллюстрации, а его разрешение меньше, чем у маски. Фон без потерь для восприятия сохраняется с разрешением 100 dpi.

Передний план хранит цветовую информацию о маске, и его разрешение обычно понижается ещё сильнее, так как в большинстве случаев цвет текста черный и одинаковый для одного печатного знака. Для сжатия переднего и заднего планов используется вейвлетное сжатие.

Заключительным этапом создания DjVu-документа становится энтропийное кодирование, когда адаптивный арифметический кодировщик превращает последовательности одинаковых символов в бинарное значение.
Задачей DjVu было сохранить «свойства» бумажного документа в цифровом виде, позволив работать с такими документами даже слабым компьютерам. Поэтому ПО для просмотра DjVu-файлов обладает возможностью «быстрого рендеринга». Благодаря ей в память загружается только тот кусочек DjVu-страницы, который должен отображаться на экране. Это также дает возможность просматривать «недокачанные» файлы, то есть отдельные страницы многостраничного DjVu-документа. При этом используется прогрессивная прорисовка деталей изображения, когда компоненты как бы «проявляются» по мере закачки файла (как в JPEG). 20 лет назад, когда был представлен этот формат, загрузка страницы происходила в три этапа: сперва грузилась текстовая составляющая, через пару секунд подгружались первые версии изображений и фон. Уже после «проявлялась» вся страница книги.

Наличие трёхуровневой структуры также позволяет осуществлять поиск по отсканированным книгам (так как есть специальный текстовый слой).

Это оказалось удобно при работе с технической литературой и справочниками, поэтому DjVu стал основой для нескольких библиотек научных книг.

Например, в 2002 году он был выбран Архивом Интернета в качестве одного из форматов (вместе с TIFF и PDF) для проекта по сохранению отсканированных книг из открытых источников.

Однако, как и все технологии, DjVu имеет свои минусы. Например, при кодировании сканов книг в формат DjVu некоторые символы в документе могут подменяться на другие, внешне похожие. Наиболее часто это происходит с буквами «и» и «н», отчего эта проблема получила название «проблема инь». Она не зависит от языка текста и влияет, в том числе, на цифры и другие мелкие повторяющиеся знаки. Её причина — ошибки классификации символов в кодировщике JB2. Он «дробит» сканы на группы по 10–20 штук и формирует для каждой из групп словарь общих символов. Словарь содержит образцы общих букв и цифр со страницами и координатами их появления. Когда вы просматриваете DjVu-книгу, символы из словаря подставляются в нужные места. Это позволяет уменьшить размеры DjVu-файла, однако, если отображения двух букв визуально похожи, кодировщик может их или перепутать, или принять за одинаковые. Иногда это приводит к порче формул в техническом документе. Для решения этой проблемы можно отказаться от алгоритмов сжатия, однако это увеличит размеры цифровой копии книги.

Другим недостатком формата является то, что он не поддерживается по умолчанию во многих современных ОС (в том числе мобильных).

Поэтому для работы с ним нужно ставить сторонние программы, такие как DjVuReader, WinDjView, Evince и др.

Однако здесь хотелось бы отметить, что некоторые электронные читалки (например, ONYX BOOX) поддерживает формат DjVu «из коробки» — так как необходимые приложения там уже установлены.

Кстати, о том, что еще могут приложения для ридеров на базе Android, мы рассказывали в одном из предыдущих материалов.

Ридер ONYX BOOX Chronos Еще одна проблема формата проявляется при работе с DjVu-документами на небольших экранах мобильных устройств — смартфонах, планшетах, ридерах. Иногда DjVu-файлы представлены в виде скана разворота книги, а профессиональная литература и рабочие документы часто имеют формат А4, поэтому приходится «двигать» изображение в поисках информации. Однако отметим, что эта проблема также решаема. Проще всего, конечно, поискать документ в другом формате — но если такой вариант невозможен (например, вам нужно работать с большим количеством технической литературы в DjVu), то можно воспользоваться электронными читалками с большой диагональю от 9,7 до 13,3 дюйма, которые специально «заточены» под работу с подобными документами.

Например, в линейке ONYX BOOX такими устройствами являются Chronos и MAX 2 (кстати, мы подготовили обзор этой модели ридера, и в скором времени опубликуем его в нашем блоге), а также Note, который имеет экран E Ink Mobius Carta с диагональю 10,3 дюйма и повышенным разрешением.

Такие устройства позволяют спокойно рассмотреть все детали иллюстраций в оригинальном размере и подойдут тем, кому часто приходится читать учебную или техническую литературу.

Для просмотра файлов DjVu и PDF используется NEO Reader, который дает настраивать контраст и толщину оцифрованных шрифтов.

Несмотря на имеющиеся у формата недостатки, на сегодняшний день DjVu остается одним из самых популярных форматов для «сохранения» литературных произведений. Во многом это обусловлено тем, что он является открытым, а обойти его некоторые технологические ограничения сегодня позволяют современные технологии и разработки.

В следующих материалах мы продолжим рассказ об истории появления форматов электронных книг и особенностях их работы.

P.S. Несколько оборов ридеров ONYX BOOX:

Источник: https://habr.com/ru/company/maccentre/blog/411545/

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.