Форматы электронных книг FB2, EPUB, MOBI и другие. Форматы и формы электронных документов

03.07.2019
2015-03-11 | Без рубрики

Человек, любящий книги, стремится читать везде и всюду. Именно поэтому в последние годы чтение с ридеров или мобильных телефонов приобрело такую огромную популярность. Конечно, мы можем сколько угодно говорить о прелестях запаха новой бумажной книги, о приятных моментах в книжном, при выборе пополнений для вашей библиотеки, но факт остается фактом - в повседневной суете читать электронные книги проще, чем таскать с собой привычные бумажные томики. Если же вы пишите и хотите, чтобы ваше творчество стало удобным и доступным для читателей, мало выкладывать тексты на открытых ресурсах, хорошо бы еще и приложить к ним файловые версии, чтобы люди смогли скачать ваше творение и оценить его на досуге.

Вне зависимости от того, читатель вы, писатель или «два в одном», при скачивании или выкладывании текстов с файлами, вы можете столкнуться с тем, кто ваш телефон или ридер не поддерживают этот формат (или же ваши читатели жалуются на то, что файлы такого формата у них не читаются). Чтобы разобраться с тем почему так происходит, мы написали для вас небольшое пояснение о том, какие бывают форматы электронных книг, чем они отличаются и в чем преимущество и недостаток каждого из них.

Виды форматов:

Для начала необходимо заметить, что наиболее распространенные форматы электронных книг это: FB2, EPUB, MOBI, PDF, RTF, TXT, DOC/DOCX и DjVu. Естественно, когда непосвященный человек сталкивается с таким многообразием, сложно разобраться что к чему и какой формат выбрать для чтения или конвертации своих файлов.

Microsoft Windows, только вот, к сожалению, DOC/DOCX не поддерживаются большинством ридеров, да и на мобильных телефонах могут не всегда открыться, а в TXT читать книги очень и очень неудобно.

Впрочем, давайте обо всем по порядку:

FB2 (FictionBook)

Преимущества: Один из наиболее распространенных форматов в русскоязычном сегменте интернета. В нем удобно структурировать документ большого объема, делить на главы и т. п. Файлы FB2 занимают немного места и легко конвертируются в другие форматы.

Недостатки: FB2 - разработанный в России формат. Он не поддерживается большинством ридеров и неизвестен по всему миру. Открывается только на устройствах с русской прошивкой и чужд брендовым ридерам, лидирующим по всему миру: Sony, Amazon Kindle, Barnes&Noble, Kobo и т. п. Да, вы можете поспорить, что на Sony FB2 открывается, но официальная прошивка, позволяющая открыть этот формат на ридерах Sony, вышла в свет всего пару лет назад и установлена далеко не на всех моделях. Если же говорить о том, чтобы продавать свои произведения на Amazon или Itunes, тот тут ответ однозначен - FB2 не подходит для международных площадок.

PDF (Adobe Portable Document Format) и DjVu (произносится «дежавю́») - не будем рассматривать каждый в отдельности и объединим их одним пунктом.

Преимущества: Оба формата используются для хранения сканированных книг. В PDF можно создавать очень красочные файлы. DjVu просто довольно неплохо сжимает файлы, благодаря чему они меньше «весят».

Недостатки: Файлы PDF получаются очень громоздкими. Если же речь идет о сканировании, то в любом случае сканированные книги неудобно читать с экрана, поскольку их качество оставляет желать лучшего вне зависимости от того в PDF выложен скан или в DjVu.

Преимущества: TXT открывается на любом ридере. DOC/DOCX известные всем форматы Microsoft Word.

Недостатки: Читать книги в TXT ужасно неудобно, поскольку в нем отсутствует форматирование текста (выравнивание по ширине, перенос абзацев, деление на главы и т.п.). DOC/DOCX поддерживается очень малым количеством устройств для чтения.

RTF (Rich Text Format)

Преимущества: Удобный и компактный формат для хранения текстовых файлов.

Недостатки: Крайне редко поддерживается ридерами и мобильными телефонами, планшетами и т. п.

Преимущества: LRF специальный формат электронный книг от Sony. MOBI формат книг для Amazon Kindle.

Недостатки: В настоящее время и Sony поддерживают более популярный формат электронных книг - EPUB.

EPUB (Electronic PUBlishing)

Преимущества: EPUB - самый распространенный в мире формат электронных книг. Не имеет проблем с распознаванием, позволяет создать хорошо структурированный текст с иллюстрациями. Этот формат сам по себе уже архив, а потому компактный и не требует дополнительных архиваторов.

Как вы можете видеть, каждый из упомянутых выше форматов имеет свои преимущества и недостатки. К примеру, безусловно, наиболее «читаемым» форматом для электронных книг будет TXT, но при этом читать книги в таком формате - это практически издеваться над своими глазами. Такой текст невозможно структурировать, в нем отсутствуют абзацы, главы, в него невозможно вставить иллюстрации и т. п.

Наиболее распространенным и удобным форматом для чтения электронных книг, является EPUB. Однако, если речь идет о том в каком виде автору выкладывать свое произведение онлайн, наиболее рациональным решением будет выкладка сразу в нескольких форматах. К примеру: EPUB (читается везде, кроме Amazon Kindle) + MOBI (читается только на Amazon Kindle) + DOC/DOCX (для тех, кому привычно читать с компьютеров и ноутбуков). Конечно, бонусом можно выложить текст и в формате FB2, к которому так привыкла русскоязычная аудитория, однако, далеко не на всех устройствах откроется файл такого формата.

И конечно же, в завершение этой статьи и на правах рекламы, хотим вам сообщить, что недавно в СНГ начала работу новая интернет-система Booqla, предназначенная для удобной и, внимание, бесплатной конвертации рукописей в форматы EPUB и MOBI. Сайт предлагает пользователям со всего мира конвертацию своих рукописей в электронный формат и оказывает помощь в продаже электронных книг, но для русскоязычной аудитории будет доступна только бесплатная конвертация рукописей.

Вы можете сами оценить простоту и удобство сервиса Booqla, зарегистрировавшись на

Вопросы о том, чем отличается форма электронного документа от формата, появились с тех самых пор, когда Федеральная налоговая служба дала добро на использование в налоговом учете электронных первичных документов. Произошло это более трех лет назад. Тем не менее, данные понятия путают до сих пор. Давайте разбираться, что есть что.

Что такое форматы электронных документов?

Чтобы ответить на этот вопрос, начнем с небольшой классификации. Весь перечень документов, используемых сегодня в организациях, можно разделить на две группы:

  1. Документы, которые можно использовать и в бумажном, и в электронном виде (товарная накладная ТОРГ-12, счет-фактура, универсальный передаточный документ, акт выполненных работ, счет на оплату, договор поставки и др.).
  2. Документы, которые разрешено применять исключительно на бумаге (копия счета-фактуры, предоставляемая агентом принципалу, товарно-транспортная накладная (ТТН), декларация соответствия и др.).

В данном случае нам интересны документы первой группы, которые по законодательству разрешено создавать, передавать и хранить в электронном виде. Правда, стоит иметь в виду, что к форматам некоторых электронных документов закон предъявляет жесткие требования, равно как и к форме ряда электронных документов.

.XML – единый формат учетных документов

ЭД, формат которых четко описан и определен законодательством, называются формализованными. К ним относятся: счет-фактура, накладная ТОРГ-12 и акт выполненных работ.

Все остальные ЭД (счета на оплату, письма, доверенности, паспорта сделки и др.) являются неформализованными. Особых требований к их форматам не существует. Форма данных электронных документов так же не важна.

Формализованные документы создаются по форматам ФНС. На сегодняшний день для электронных подлинников законодательно утвержден единый формат – .XML, для отсканированных копий - .JPG, .TIFF, .PDF, .PNG.

Что интересно: есть обязательный к применению формат электронного счета-фактуры, соответствующий требованиям ФНС, – это.XML. А есть рекомендованные форматы для акта и ТОРГ-12, и это тоже.XML. Несмотря на то что обмениваться первичкой вы можете в любых форматах, при истребовании в электронном виде налоговая примет только документы в формате.XML. Если же вы обмениваетесь первичкой в другом формате, представлять ее в ФНС вам придется на бумаге. Неудобно, неправда ли? Поэтому, чтобы избежать путаницы, мы советуем вам использовать форматы, рекомендованные ФНС.

Форма электронного документа – не есть его формат

Шаг за шагом мы приближаемся к пониманию того, что представляет собой формат электронного документа. На самом деле определений данного понятия может быть несколько. Это и структурированный набор данных, удобный для хранения и автоматической обработки. Форматом можно назвать и закодированную текстовую информацию, которая отвечает за распределение и представление данных в ЭД.

Ниже вы видите, как выглядит электронный счет-фактура в формате.XML. Его тело состоит из элементов разметки и самого массива данных. Ознакомиться с требованиями, предъявляемыми к формату электронного счета-фактуры, можно в тексте Приказа ФНС от 04.03.2015 № ММВ-7-6/93@ .

Теперь перейдем к форме. Если формат отвечает за «внутреннее содержание», то форма электронного документа являет собой его «лицо». Другими словами, то, как выглядит ЭД на экране компьютера или на бумаге, и есть его форма. Для некоторых документов закон определяет жесткую форму. Это в первую очередь касается счета-фактуры, форма которого утверждена Постановлением Правительства РФ от 26 декабря 2011 г. N 1137 .

Итак, давайте сделаем выводы. Среди всего массива форм и форматов существуют обязательные к применению и рекомендованные. Чтобы раз и навсегда уяснить положение дел с формами и форматами электронных документов, просто ознакомьтесь со следующей таблицей.

Наименование ЭД Формат Обязательность применения формата Форма Обязательность применения формы
Счет-фактура .XML В соответствии с Приказом ФНС от 04.03.2015 № ММВ-7-6/93@ формат.XML обязателен к применению. Форма разработана и утверждена. Форма счета-фактуры определена Постановлением Правительства РФ от 26 декабря 2011 г. N 1137 и обязательна к применению.
Акт выполненных работ Согласно Приказу ФНС от 21.03.2012 N ММВ-7-6/172@ утвержден рекомендованный к применению формат.XML. Единой формы акта не предусмотрено. ФЗ 402 «О бухгалтерском учете» предусматривает лишь обязательные реквизиты, которым должна отвечать форма акта.
Товарная накладная ТОРГ-12 .XML, .PDF, .DOC, .XLS, .JPEG, .TIFF и др. Согласно Приказу ФНС от 21.03.2012 N ММВ-7-6/172@ утвержден рекомендованный к применению формат.XML. Форма утверждена, содержится в «Альбоме унифицированных форм первичной учетной документации по учету торговых операций». Однако с 2013 г. применять её не обязательно. Начиная с 01.01.2013 г., форму товарной накладной вправе определять руководитель организации. При этом в ней должен содержаться ряд обязательных реквизитов (ФЗ 402 «О бухгалтерском учете»).


Электронные книги (ридеры, читалки) уже давно стали привычными устройствами для широкого круга пользователей. Их достоинства: доступность контента (скачать необходимую книгу из интернета можно за считанные минуты), не портящий зрение экран E-ink, возможность иметь в ридере коллекцию из тысяч книг, долгая работа на одной зарядке, настройки типа и размера шрифта. Не так давно появились электронные книги с подсветкой экрана - они позволяют читать в полной темноте. В общем, преимущества ридеров можно перечислять очень долго.

Однако при знакомстве с читалками у пользователей часто возникает одна проблема. Люди, которые решают приобрести ридер в первый раз, сталкиваясь с понятием "форматы электронных книг", часто не понимают о чем идет речь. Проблема особенно актуальна для начинающих, которым аббревиатуры "FB2", "EPUB" или "MOBI" совершенно ничего не говорят.

Так называемые форматы - это различные типы электронных текстовых файлов, которые поддерживаются (воспроизводятся) тем или иным . В электронных библиотеках интернета часто предлагается большой набор типов файлов: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT и других. Выбор широк, и это ставит перед новичками определенные проблемы. Мы опишем основные форматы электронных книг, расскажем о том, чем отличаются друг от друга, какими читалками поддерживаются, и на каком формате лучше остановить свой выбор, если у вас мультиформатный ридер, читающий все форматы.

Разновидности форматов

1. FB2 (FictionBook) - формат электронных книг, который был создан группой российских разработчиков. Книги в этом типе файлов имеют структурированный вид (то есть содержат разбивку по главам, содержание, иллюстрации, обложку). Кроме того, этот стандарт хранит информацию о файле (так называемые тэги: автор, название, жанр), которая считывается ридером и позволяет пользователю удобно сортировать файлы на устройстве. Данный типа файлов занимает небольшой объем, может быть заархивирован, а еще он хорошо конвертируется в другие форматы. Из особенностей: в виду того, что формат изначально был разработан под кириллицу, тексты на русском языке в FB2 имеют переносы слов.

Формат был изначально рассчитан на российских пользователей, и он практически не используется за границей. Именно поэтому FB2 не поддерживается популярными мировыми производителями читалок - Amazon и Barnes & Noble. Зато это основной формат файлов для популярных в России читалок от Pocketbook, Onyx и Wexler. Кроме того, ридеры Sony теперь поддерживают FB2 - после выхода на российский рынок компания разработала официальную прошивку для ридера , которая позволяет читать книги в FB2.

2. EPUB (Electronic PUBlication) - самый популярный в мире электронный формат для читалок. С ним работают ридеры Barnes & Noble и Sony. По структуре верстки этот тип файла напоминает заархивированную веб-страницу, содержащую текст, графику, встроенные шрифты, иллюстрации.

Помимо западных брендов, формат EPUB поддерживается моделями производителей, ориентированных на российских рынок (Pocketbook, Onyx, Wexler) по причине стремительного роста популярности в нашей стране. Кроме того, данный стандарт электронных книг используют iPhone и . Фирменная эппловская программа для чтения iBooks поддерживает именно EPUB.

3. MOBI - формат электронных книг ридеров . Получает распространение в российских онлайн-библиотеках по мере того, как Kindle становится все более популярным в России. Другие ридеры имеют поддержку этого формата "для галочки". MOBI по своим свойствам схож с EPUB. Недавно Amazon представил еще один формат электронных текстов Kindle Format 8 или KF8 (его отличает более богатое форматирование) с уточнением, что новые и старые читалки Amazon не перестанут поддерживать MOBI.

4. TXT - формат простых текстовых документов. Преобразовать текст из другого формата в TXT можно простейшим действием "копировать-вставить". Несмотря на то, что данный тип файла поддерживает практически всеми читалками и занимает в памяти очень мало места, читать в нем книги на ридерах мы бы не рекомендовали. В TXT отсутствует форматирование, разметка, переносы, выравнивание. Он подходит для коротких текстовых заметок, но не для полноценных электронных книг.

5. PDF (Portable Document Format) - формат электронных документов, созданный компанией Adobe Systems. Неудобен для использования на ридерах по ряду причин. Во-первых, файлы этого форматах очень громоздкие, так как рассчитаны под мощности компьютера, и на читалках открываются достаточно медленно. Во-вторых, если файл специально не сверстан под экран 6-дюймового ридера, имеющий формат аналогичный бумажному листу размера A6, то читать на нем PDF формата A4 (а большинство PDF-файлов представлены именно в размере стандартного бумажного листа), будет очень трудно. В PDF можно увеличить только масштаб, но не размер шрифта, а значит, на экране получится разместить только какую-то часть страницы. Читать страницы придется по частям, а это очень неудобно.

Для чтения PDF приспособлены , размер экрана которых позволяет воспроизвести страницу в масштабе, достаточно крупном для комфортного чтения.

6. DJVU - формат, разработанный для хранения сканированных документов - книг, статей, рукописей. Книга в DJVU фактически представляет собой набор сканированных страниц. В плане комфортности чтения на 6-дюймовых читалках - все аналогично истории с PDF. Вы не увеличите размер шрифта, а только масштаб. При зумировании страница вылезет за пределы экрана, и надо будет постоянно перемещать область увеличенного текста для чтения - о комфортном чтении говорить не приходится. Для чтения DJVU выбирайте риедры с экраном 9 дюймов. Впрочем, даже на 9-дюймовых читалках возможности удобного чтения DJVU зависят от того, насколько качественно отсканирована книга, представленная в этом формате.

7. LRF - в прошлом фирменный формат ридеров Sony. На новых моделях (начиная с PRS-T1) уже не используется, так как уступил свое место EPUB. Очень плохо конвертируется в другие типы файлов. Несмотря на то, что кое-где в библиотеках еще представлен, использовать его рекомендуется исключительно владельцам старых моделей Sony.

8. RTF (Rich Text Format) - формат для хранения текстовых документов. Относится к категории "компьютерных", а не "книжных". На ридерах читать в RTF не слишком удобно - это большие по объему файлы, и скорость работы читалки на порядок снижается.

9. DOC (а также DOCX ) - текстовые документы Microsoft Office. Эти форматы поддерживают достаточно много ридеров, но именно для чтения документов, а не книг. Файлы большого объема в этом формате могут быть велики по размеру, и работать с ними на ридерах непросто. Многостраничные книги в DOC лучше конвертировать в FB2 или EPUB.

Основные форматы электронных книг мы перечислили. Совсем экзотические типы файлов, которые иногда встречаются в интернете, мы рассматривать не станем, а лучше определимся, в каких из вышеперечисленных форматов удобнее всего читать книги на электронных ридерах.

Какой формат электронных книг выбрать

Если у вас читалка с поддержкой всех форматов, то остановить свой выбор на определенном типе файла, можно исходя из ряда факторов. Допустим, Вы покупаете свою первую электронную книгу, и у вас нет предварительно собранной коллекции книг, например, в FB2. В этом случае выбирайте тот формат файла, который лучше всего воспроизводится вашим ридером. Традиционные "книжные" форматы EPUB или FB2 для ридера (да и для пользователя) более предпочтительны и удобны, чем "компьютерные" PDF, TXT, DOC, DOCX и RTF.

В случае с 9-дюймовыми читалками и необходимостью чтения DJVU и PDF при прочих равных советуем отдавать предпочтение последнему, так как PDF представляет собой более современный формат, а книги в DJVU часто бывают плохого качества.

С точки зрения удобства использования плюсы "книжных" форматов очевидны: EPUB, FB2 или MOBI визуально лучше выглядят в меню Вашего ридера (отображаются обложки книг), их удобнее сортировать (есть тэги: автор, название, жанр), они занимают в памяти гораздо меньше места и скорость работы читалки с такими форматами будет существенно выше.

Нужна ли поддержка всех форматов

На наш взгляд, совсем необязательно выбирать всеформатный ридер. Многие пользователи, имеющие читалки с поддержкой всех форматов, загружают книги одном-двух типах файлов. У всех читалок (в том числе у мультиформатных), так или иначе, есть основной формат, и размениваться на другие вы в итоге не станете. Для Pocketbook, Onyx и Wexler основные форматы - это FB2 или EPUB, для Barnes & Noble () и Sony - EPUB, для Kindle - MOBI.

В случае с читалками Amazon и Barnes & Noble, если нужная книга оказывается в формате, который эти ридеры не поддерживают, можно воспользоваться конвертером (например, Calibre). Это программа, устанавливаемая на компьютер и позволяющая переконвертировать тот же FB2 в MOBI или EPUB за считанные минуты.

Читать книги в родном для ридера формате лучше, чем использовать установленные на читалку дополнительные программы. Наш совет: потратьте несколько минут для того, чтобы преобразовать книгу, например, из RTF в EPUB с помощью конвертера Calibre . Это удобней, чем читать ее "в оригинале" с помощью дополнительно установленной программы (на Sony PRS-T1 или Kindle) или столкнуться с более медленной работой устройства (например, на ридерах Pocketbook).

Помните, что главное - удобство пользования электронной книгой, а не количество форматов, заявленных у нее в параметрах.

Приятного чтения!

Форматы файлов — основа работы с цифровыми фотографиями. расскажет вам о всех основных форматах графических файлов.

RAW.

Формат файлов содержащий необработанную информацию, поступающую напрямую с матрицы фотокамеры. Эти файлы не обрабатываются процессором камеры (в отличие от JPG) и содержат оригинальную информацию о съемке. RAW может быть сжат без потери качества.

Преимущества RAW очевидны — в отличие от JPG, который был обработан в камере и уже сохранен с сжатием данных — RAW дает широчайшие возможности по обработке фотографии и сохраняет максимальное качество.

Заметка. Разные производители фототехники используют разные алгоритмы для создания RAW в своих камерах. Каждый производитель придумывает собственное разрешение для своего RAW-файла — NEF — Nikon, CR2 — Canon…

JPEG (он же JPG).

Это самый распространенный формат графических файлов.

Свою популярность JPG заслужил гибкой возможностью сжатия данных. При необходимости изображение можно сохранить с максимальным качеством. Либо сжать его до минимального размера файла для передачи по сети.

В JPG применяется алгоритм сжатия с потерей качества. Что это нам дает? Явный минус такой системы — потеря качества изображения при каждом сохранении файла. С другой сжатие изображения в 10 раз упрощает передачу данных.

На практике, сохранение фотографии с минимальной степенью сжатия не дает видимого ухудшение качества изображения. Именно поэтому JPG — самый распространенный и популярный формат хранения графических файлов.

TIFF.

Формат TIFF очень популярен для хранения изображений. Он позволяет сохранять фотографии в различных цветовых пространствах (RBG, CMYK, YCbCr, CIE Lab и пр.) и с большой глубиной цвета (8, 16, 32 и 64 бит). TIFF широко поддерживается графическими приложениями и используется в полиграфии.

В отличии от JPG, изображение в TIFF не будет терять в качестве после каждого сохранения файла. Но,к сожалению, именно из-за этого TIFF файлы весят в разы больше JPG.

Право на формат TIFF в данный момент принадлежит компании Adobe. Photoshop может сохранять TIFF без объединения слоев.

PSD.

Формат PSD используется в программе Photoshop. PSD позволяет сохранять растовое изображение со многими слоями, любой глубиной цвета и в любом цветовом пространстве.

Чаще всего формат используется для сохранения промежуточных или итоговых результатов сложной обработки с возможностью изменения отдельных элементов.

Так же PSD поддерживает сжатие без потери качества. Но обилие информации, которое может содержать PSD файл, сильно увеличивает его вес.

BMP.

Формат BMP один из первых графических форматов. Его распознает любая программа работающая с графикой, поддержка формата интегрирована в операционные системы Windows и OS/2.

BMP хранит данные с глубиной цвета до 48 бит и максимальным размером 65535×65535 пикселей.
На данный момент формат BMP практически не используеться ни в интернете (JPG весит в разы меньше), ни в полиграфии (TIFF справляеться с этой задачей лучше).

GIF.

Формат GIF был создан на заре интернета для обмена изображениями. Он может хратить сжатые без потери данных изображения в формате до 256 цветом. Формат GIF идеально подходит для чертежей и графиков, а так же поддерживает прозрачность и анимацию.
Так же GIF поддерживает сжатие без потери качества.

PNG.

Формат PNG создан как для улучшения, так и для замены формата GIF графическим форматом, не требующим лицензии для использования. В отличии от GIF, у PNG есть поддержка альфа-канала и возможность хранить неограниченное количество цветов.

PNG сжимает данные без потерь, что делает его очень удобным для хранения промежуточных версий обработки изображений.

JPEG 2000 (или jp2).

Новый графический формат, созданный для замены JPEG. При одинаковом качестве размер файла в формате JPEG 2000 на 30% меньше, чем JPG.

При сильном сжатии JPEG 2000 не разбивает изображение на квадраты, характерные формату JPEG.

К сожалению, на данный момен этот формат мало распростанён и поддерживается только браузерами Safari и Mozilla/Firerox (через Quicktime).