Описание работы пакета OOoFBTools I Конвертер ExportToFB21 1. Описание

Описание работы пакета OOoFBTools

I Конвертер ExportToFB21

1. Описание

1.1. Назначение

Кроссплатформенный конвертер ExportToFB21 предназначен для конвертации документов из форматов, поддерживаемых OpenOffice.org Writer в формат fb2.1.

Т.о. входные форматы документов для ExportToFB21 следующие:.doc, dot, rtf, txt, html, htm, oth, odt, ott, stw, sdw, xml, vor, psw, wps, wpd, fodt, sxw, Microsoft Word 2003XML.xml, и другие, с которыми работает OpenOffice.org Writer.

Конвертер работает на тех платформах, где работает OpenOffice.org Writer, т. е. MS Windows 98/2000/XP/Vista, MacOS X, GNU/Linux, FreeBSD и т. д.

Конвертер не использует DOM технологию – задействован свой парсинг документов и печать в текстовый файл информации, собранной после анализа.

Если документ отформатирован стилями (см. п.3.) правильно (см. п.5.), то после его конвертации практически не требуется дальнейшая правка (за редким исключением, о чем см. п.7.) в редакторах fb2 формата! После проведения десятков тестов с документами различной структуры, полученные fb2 книги у меня всегда проходили валидацию.

1.2. Что реализовано

Конвертер писался для конвертации документов именно в формат fb2.1. Поэтому в нем реализованы почти все основные возможности этого формата.

1.2.1. Экспорт Description:

1. ‹title-info› – весь

2. ‹document-info› – весь

3. ‹publish-info› – весь

4. ‹custom-info› – весь

5. Аннотация к документу

6. История документа

1.2.2. Экспорт основных элементов структуры документа

1. Экспорт структуры текста (слов и абзацев).

2. Экспорт сносок и гиперссылок (на web странички).

3. Экспорт стилей абзацев, аннотаций, эпиграфов, цитат, поэм, заголовков, подзаголовков (т. е. теги ‹strong›, ‹emphasis›, ‹strikethrough›, ‹sub›, ‹sup›, ‹code›).

4. Экспорт стилей авторов цитат, авторов поем, авторов эпиграфов. Для поэм реализованы заголовки – ‹title›

5. Экспорта стилей текста сносок (т. е. все курсивы, полужирные начертания, верхние и нижние индексы и т. д. отображаются и в тексте сносок).

6. Для Поэм (Стихов) реализован заголовок ‹title›

7. Реализована возможность использования Аннотации на любом уровне (части книги, глав…).

8. Экспорт картинок и картинок-буквиц.

9. Число уровней вложений ‹section› – 10. При желании его можно увеличить хоть до бесконечности, внеся некоторые изменения в код конвертера (подсказка: ищите строки проверки на “Level 1”, “Level 2” и т. д. и дополняйте эти строки до нужного вам числа уровней. Всего процедур таких 3-4). Тогда нужно будет создать и соответствующие стили для новых уровней.

10. Экспорт простых и сложных Таблиц с экспортом заголовков, выравниванием текста заголовков и ячеек, а так же форматирования стилями (полужирный, курсив, верхний/нижний индексы и т. д.), гиперссылок и переходов из строк таблицы в другие места файла. Работает экспорт сносок для строк ячеек таблиц. Экспорт нумерованных списков-абзацев, маркированных списков, а также списков с маркерами-картинки в ячейке. Сделан экспорт Картинок из ячеек Таблиц.

11. Самая главная фишка конвертера при работе с ‹section› – корректный экспорт самой разной структуры документа, без лишних, или наоборот, недостающих ‹section› или ‹/section›! Подробности см. ниже. Так что не нужно будет мучиться, отлавливая, где чего не хватает, чтобы документ fb2 прошел валидацию. Конечно, все это – при условии правильного задания стилями уровней заголовкам!

1.2.3. Дополнительные возможности

1. Реализовано 10 уровней вложения заголовков (‹section›‹title›Заголовок‹title›‹/section›). Но, алгоритм построен таким образом, что путем внесения в 3 процедуры нескольких строк кода, число вложений – уровней можно довести хоть до бесконечности! Мне больше 10 никогда не требовалось.

2. Реализована обработка «проблемных» символов ( amp;, ‹, ›), и замена их в fb2 файле на amp;amp; amp;lt; и amp;gt; соответственно. Иначе книга не проходит валидацию! Эта опция хороша для экспорта технической литературы. Для другого вида книг, если вы уверены, что этих символов там нет, опцию лучше отключить – скорость экспорта увеличится в несколько раз!

3. Возможность вставки перед сноской пробела (опция в Настройках).

4. Возможность выбора стиля сносок: x, [x], [x], {x}, { x }, (x), (x) (опция в Настройках).

5. Возможность собирать авторов поемы, цитат или эпиграфа в одну строку, или оставить авторов одного под другим (опции в Настройках).

6. Возможность собирать Subtitle в одну строку, или оставить подзаголовки один под другим (опция в Настройках).

7. Возможность удаления пустых строк (опция в Настройках).

8. Экспорт Текстовых Врезок как просто текст, как цитат, как таблиц или как структуру (опция в Настройках). Экспорт всех стилей (и символьных и абзацевых) и нумерованных списков во Врезках. Экспорт Таблиц и Картинок из Текстовых Врезок. Распознается привязка Картинок только как «К Абзацу», «К символу» и «Как символ». Другие – игнорируются и Картинка не будет экспортирован! Вложенные Врезки во Врезки игнорируются!

9. Экспорт Нумерованных и Маркированных Списков (в том числе и с Маркеров- Картинок) из Текста документа и Текстовых Врезок.

10. Экспорт текстовых полей, вставленных из меню “Вставка” – › ”Поля”.

11. Экспорт ссылок внутри документа (переход из любого места документа в любое место документа, переход из любого места документа на текст любой сноски, переход из текста одной сноски на текст другой сноски, переход с текста сноски на любое место документа) (опция в Настройках).

12. Сохранение профиля пользователя и его автоматическая загрузка для полей Автора fb2-документа, OCR и истории fb2-документа.

13. Сохранение и загрузка профиля для Автора Книги и его жанра.

14. Сохранение и загрузка профиля для Издательства.

15. Автоматическое заполнение полей формы конвертера «Аннотация на Книгу», всех полей группы «Бумажная книга (Publish-Info)» из текста документа с помощью т. н. «Служебных стилей»

16. Есть Корректор Текста – замена кавычек «елочкой», удаление лишних пробелов и многое другое…

17. Виртуальные клавиатуры.

18. Валидатор fb2-файлов (пока только для системы Windows).

19. Локализация всего пакета на Русский и Английский языки.

20. Экспорт Нумерованных и Маркированных Списков (в том числе и с Маркеров- Картинок) из Текста Сносок (Примечаний).

1.3. Что пока не реализовано

1 Для таблиц не реализован экспорт перехода из документа на определенный абзац таблиц, а так же экспорт стихов, цитат, аннотаций, эпиграфов, подзаголовков и заголовков (Уровней) из таблиц. Не знаю – надо ли это?

2 Для Текстовых Врезок не сделан экспорт перехода из документа на определенный абзац Врезки.

3. Экспорт обложек из Врезок (расположены выше Названия Книги – стиль Book Title).

1.4. Лицензионное соглашение

Конвертер создается и распространяется под лицензией GPL. Т. е. его можно свободно использовать, распространять, на базе его кода создавать свои проекты, тоже под лицензией GPL.

Поделитесь на страничке

Следующая глава >

Похожие главы из других книг:

Описание режимов работы

Из книги автора

Описание режимов работы В общем случае процесс разработки и администрирования веб-сайтов в программе HtmlPad выглядит во многом аналогично тому, как это происходит в программе CatsHtml, с которой мы познакомились в предыдущей главе. Открыв или создав документ, вы выбираете


Описание режимов работы

Из книги автора

Описание режимов работы Далее мы будем последовательно рассматривать действия, необходимые для создания полноценного веб-документа средствами программы NeonHtml. В частности, мы рассмотрим, как осуществляется построение структуры будущей веб-страницы, как формируется и


Описание режимов работы

Из книги автора

Описание режимов работы Далее мы рассмотрим основные режимы работы, необходимые для создания полноценного веб-документа средствами программы Extra Hide Studio. Начнем с самого начала – с построения структуры веб-документа, после чего добавим и отформатируем текстовый контент,


4.3.1. Общее описание и методика работы

Из книги автора

4.3.1. Общее описание и методика работы Что за зверь эта GNOMEСреда GNOME (GNU Network Object Model Environment — Сетевая Объектная Среда GNU) — один из основных конкурентов среде KDE. Среда GNOME (www.gnome.org) является частью проекта GNU (www.gnu.org), начатого в 1984 году и ставящего своей целью создание


Описание режимов работы

Из книги автора

Описание режимов работы После того как настроено подключение к Интернету и выполнена настройка Интернет-обозревателя, можно приступать к работе в Сети. В данном разделе приводится описание основных режимов работы Интернет-обозревателя Internet Explorer 8. Вы узнаете, как


Описание режимов работы

Из книги автора

Описание режимов работы Итак, после установки и настройки программы можно приступать к ее эксплуатации. Здесь мы расскажем о том, как пользоваться Интернет-обозревателем Mozilla Firefox для работы в Интернете.Чтобы посетить тот или иной веб-ресурс, необходимо знать его адрес.


Описание режимов работы

Из книги автора

Описание режимов работы Здесь мы рассмотрим основные режимы работы с электронной почтой в программе Microsoft Outlook: создание и отправка писем, получение корреспонденции, и др. Но вначале еще раз вспомним, как выглядит почтовый интерфейс программы (рис. 5.16). Рис.


Описание режимов работы

Из книги автора

Описание режимов работы В данном разделе мы кратко рассмотрим, какие основные действия нужно выполнить для подготовки рекламных материалов средствами программы Publisher 2007.Как мы уже отмечали выше, при запуске программы открывается ее стартовое окно (см. рис. 7.1). В нем


Описание режимов работы

Из книги автора

Описание режимов работы В данном разделе мы рассмотрим основные приемы и методы использования программы Project


Планы по развитию пакета OOoFBTools (TODO)

Из книги автора

Планы по развитию пакета OOoFBTools (TODO) A. Конвертер ExportToFB211. Сделать то, что не реализовано (см. п.1.3.), по мере возможности и способности.2. Оптимизация скорости парсинга.3. Минивалидатор форматирования стилями текста – выдает сообщение о соответствии/не соответствии


8.11 Описание Asm

Из книги автора

8.11 Описание Asm Описание Asm имеет видasm ( строка );Смысл описания asm неопределен. Обычно оно используется для передачи информации ассемблеру через компилятор.9. ОператорыОператоры выполняются последовательно во всех случаях кроме особо


Описание графика и процесса работы

Из книги автора

Описание графика и процесса работы И вот вы перешли на уровень выше, решив посвятить все свое время профессии микростокового фотографа. Конечно, появляются преимущества самостоятельного планирования своего рабочего дня и общего графика. Но поддаваться соблазну


Описание

Из книги автора

Описание Описание фактически является заголовком вашей работы. Оно выполняет такую же функцию, как ключевые слова. Но если «ключевики» представляют собой простой непоследовательный большой набор слов, характеризующих детали изображения, то описание является связной


Описание

Из книги автора

Описание На названии (или описании) в первую очередь попадаются начинающие микростоковые фотографы и те, у кого в школе не было проблем с описанием картин на уроках русского языка. Если вам отказали по причине ошибки в названии изображения, значит, вы слишком увлеклись


§ 4.2 Описание функций и основные приемы работы

Из книги автора

§ 4.2 Описание функций и основные приемы работы Как нетрудно догадаться, FB Editor позволяет редактировать файлы в формате FB2. Довольно скромный набор функций частично компенсируется возможностью прямого редактирования XML-файла книги.Механизм работы редактора не так прост,