Глава 37. Экспорт результатов распознавания во внешние приложения

Глава 37.

Экспорт результатов распознавания во внешние приложения

Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск, скопировать в буфер обмена или отправить по электронной почте. Сохранить можно все страницы или только выбранные.

В программе ABBYY FineReader вы имеете возможность:

• Сохранить распознанный текст, используя Мастер сохранения результатов.

• Сохранить открытую или выделенные в диалоговом окне Пакет страницы в файл или во внешнее приложение.

• Сохранить все страницы пакета в файл или во внешнее приложение.

• Сохранить изображение страницы.

• Передать результаты распознавания в выбранное приложение или сохранить их в файл. Внешний вид иконки меняется в зависимости от выбранного режима сохранения; подпись Сохранить меняется на название выбранного приложения.

Как сохранить распознанный текст

Нажмите стрелку справа от кнопки 4-Сохранить и из меню выберите необходимую команду.

Важно: В процессе сохранения части страниц сначала выделите их в диалоговом окне Пакет.

После того, как вы экспортировали распознанный текст в выбранное вами приложение, отправили его по электронной почте, передали в буфер или сохранили в файл, «информация» об этом действии отразится на иконке кнопки 4-Сохранить. Поэтому для того с тем, чтобы повторить ту же операцию для другого изображения, вам достаточно нажать на эту иконку.

Опции сохранения распознанного текста

Опции сохранения распознанного текста устанавливаются на закладке Форматирование диалогового окна Опции (доступ: Сервис к Опции). Кроме того часть этих опций можно установить в диалоговых окнах Мастер сохранения результатов и Сохранить текст как.

• Режим сохранения форматирования и раскладки распознанного текста

• Сохранять или не сохранять картинки в распознанном тексте

• Используемые шрифты

• Сохранять все страницы пакета или только выделенные

• Режимы передачи страниц пакета

• Режим сохранения форматирования и раскладки распознанного текста (при сохранении в форматах RTF, DOC или HTML)

• Сохранять полное оформление документа — сохраняется полное оформление документа: разбиение на абзацы, гарнитура и размер шрифта, колонки, направление текста, цвет букв и фон текста. Сохраняется структура таблиц.

• Сохранять начертание и размер шрифта — сохраняется структура таблиц, разбиение на абзацы, начертание и размер шрифта.

• Не сохранять оформление — в этом случае сохраняется разбиение на абзацы и структура таблиц.

Важно: Вы имеете возможность установить дополнительные опции для каждого формата, в котором FineReader сохраняет распознанный текст. К примеру, для формата RTF/DOC вы имеете возможность указать формат страницы, выделять ли ошибки цветом; для формата HTML — разрешение картинки, кодовую страницу; при сохранении в формате PDF текстов, использующих отличную от латинской кодовую страницу (например, кириллическую, греческую), указать используемые шрифты Туре 1.

Сохранять/не сохранять картинки

Дает возможность сохранить картинки в распознанном тексте. Эта опция доступна при сохранении в форматы RTF, DOC или HTML.

Используемые шрифты (при сохранении в форматах RTF, DOC или HTML)

В программе ABBYY FineReader в процессе сохранения в файл или передачи распознанного текста в приложение используются шрифты, установленные на закладке Форматирование в разделе Шрифты. Вы имеете возможность изменить шрифты в диалоговом окне Текст или, выбрав другие шрифты на закладке Форматирование, перераспознать изображение.

Сохранять все или только выделенные страницы

Дает возможность сохранить все страницы пакета или только выделенные. В процессе сохранения или экспорте части страниц, сначала выделите их в диалоговом окне Пакет.

Режимы передачи страниц пакета (при сохранении нескольких страниц пакета)

Каждая страница в отдельный файл — дает возможность сохранить каждую страницу пакета в отдельный файл. В этом случае к названию файла в конец автоматически добавляется порядковый номер страницы в пакете.

• Пофайловое деление по изображениям — дает возможность собрать распознанный текст с многостраничных изображений в один файл.

• Пофайловое деление по пустым страницам — дает возможность сохранить каждую группу страниц в отдельный файл. Деление по группам производится по пустым страницам.

• Все страницы в один файл — дает возможность сохранить все (или все выделенные) страницы пакета в один файл.

Сохранение распознанного текста в форматах RTF и DOC

Режимы сохранения оформления и режим сохранения картинок устанавливаются на закладке Форматирование диалогового окна Опции (доступ: Сервис к Опции).

Важно: В программе abbyy finereader в процессе сохранения в форматах RTF или DOC используются шрифты, установленные на закладке Форматирование диалогового окна Опции (доступ: Сервис к Опции), или те, которые вы выбрали в процессе редактирования текста в диалоговом окне Текст.

Важно: Для более удобного редактирования распознанного текста в Microsoft Word вы имеете возможность сохранить выделение цветом неуверенно распознанных символов. Для этого на закладке RTF/DOC в разделе Выделять неуверенно распознанные символы выберите цвет из Цветом фона или Цветом символа.

Ошибки в сохраненном *.rtf (*.doc) файле будут выделены указанным вами цветом.

Сохранение распознанного текста в формате PDF

Опции сохранения оформления документа:

• Только текст и картинки — сохраняется распознанный текст и имеющиеся в тексте картинки.

• Текст поверх изображения картинки — изображение передается картинкой. Текстовые области записываются как текст поверх картинки.

• Текст под изображением картинки — все изображение сохраняется как картинка. Под нее «записывается» распознанный текст. В этом случае, сохраняется полный дизайн документа: цветовые выделения шрифта, фона, оформление бумаги. Эта опция может использоваться, например, для составления архивов документов: полностью сохраняется исходное оформление документа, при этом появляется возможность использования функции полнотекстового поиска по ним.

Для того, чтобы установить опции при сохранении в формате PDF из меню Сервис выберите команду Форматы. На закладке pdf диалогового окна Форматы установите требуемые опции.

Важно: В программе abbyy finereader в процессе сохранении в режиме Только текст и картинки и в режиме Текст поверх изображения страницы вы имеете возможность сделать так, чтобы при сохранении текста в формат PDF неуверенно распознанные слова заменялись их соответствующими изображениями. Для этого на закладке PDF диалогового окна Форматы активизируйте опцию Заменять неуверенно распознанные слова их изображениями.

Режимы использования шрифтов при сохранении в формате PDF

При сохранении в формате PDF следует указать режим использования шрифтов. Для текстов, использующих отличную от латинской кодовую страницу (например, кириллическую, греческую, чешскую), следует выбрать один из режимов для работы с Туре 1 шрифтами, а также шрифты Туре 1. Эти шрифты должны быть подключены через программу Adobe Type Manager.

Использовать стандартные шрифты Acrobat Reader — pdf-файл ссылается на стандартные системные шрифты Times, Helvetica и CourierNew.

Ссылаться на Typ e 1 шрифты — в pdf-файл пишутся ссылки на Туре 1 шрифты, сами шрифты не встраиваются. Шрифты, на которые ссылается PDF-файл, должны быть установлены и подключены через Adobe Type Manager.

Встраивать Typ e 1 шрифты — Туре 1 шрифты встраиваются в PDF-файл. Встраиваемые шрифты должны быть подключены через Adobe Type Manager.

Важно: В случае, если у вас отсутствуют шрифты Туре 1, то для сохранения любых документов в формате PDF вы имеете возможность использовать опцию Использовать стандартные шрифты Acrobat Reader. Кроме этого помните, что символы из кодовых страниц, отличные от кодовой страницы Latin (например, Cyrillic, Greek, Czech), будут правильно отображаться лишь в версиях программы Acrobat Reader 3.x. Символы же из кодовой страницы Latin будут правильно отображаться в любых версиях программы Acrobat Reader.

В режиме Ссылаться на Туре 1 шрифты в pdf-файле прописываются только ссылки на используемые шрифты (в отличии от режима Встраивать Туре 1 шрифты, когда используемые шрифты встраиваются в pdf-файл), так, чтобы полученный PDF-файл занимал меньше места на диске, чем этот же файл, сохраненный в режиме Встраивать Туре 1 шрифты.

Сохранение в режиме Встраивать Туре 1

Шрифты дает возможность другим пользователям просматривать, редактировать и печатать документ с использованием исходных шрифтов, даже если эти шрифты не установлены на данном компьютере.

Как указать программе, какие использовать шрифты Туре 1

Нажмите на кнопку Шрифты Туре 1 на закладке pdf диалогового окна Форматы (доступ: Сервис к Форматы).

Важно: В диалоговом окне Шрифты Туре 1 необходимо указать все шрифты: с засечками, без засечек, моноширинный.

Сохранение распознанного текста в формате HTML

Режимы сохранения оформления устанавливаются на закладке Форматирование диалогового окна Опции (доступ: Сервис к Опции).

Важно: В программе abbyy finereader в процессе сохранения в формате html используются шрифты, установленные на закладкеФорматирования диалогового окна Опции (доступ: Сервис к Опции), или те, которые вы выбрали в процессе редактирования текста в диалоговом окне Текст.

Как сохранить картинки в HTML — файле

На закладке Форматирование диалогового окна Опции (доступ: Сервис к Опции) активизируйте опцииСохранять картинки.

Важно: Картинки сохраняются в отдельные файлы с расширением *.jpg.

Форматы HTML

Полный

Совместим с обозревателем Internet Explorer — файл записывается в формате HTML 4.0, что дает возможность точно передать оформление документа, используя при этом таблицу стилей, которая встраивается в html-файл.

Простой

Совместим со всеми обозревателями Internet. В этом случае файл записывается в формате HTML 3.0. Оформление сохраняется приблизительно (не сохраняются отступы первой строки, неточное сохранение размера шрифта), но зато этот формат поддерживается всеми обозревателями Internet.

Авто

Простой и Полный форматы сохраняются в один файл — в один файл сохраняются два формата (Простой и Полный), при этом при отображении файла в обозревателе Internet автоматически выбирается один из них в соответствии с типом и версией обозревателя Internet.

Как установить формат HTML

На закладке HTML диалогового окна Форматы

(доступ: Сервис к Форматы) в разделе

Форматы активизируйте необходимый переключатель.

Важно: В программе abbyy finereader кодовая страница определяется автоматически. В случае, если вы хотите поменять кодовую страницу, обратитесь к полю данных Кодовая страница через закладку HTML диалогового окна Форматы.

Сохранение изображения страницы

Для этого выделите страницу в пакете, из меню Файл выберите команду Сохранить изображение как, в раскрывшемся диалоговом окне Сохранить изображение как выберите диск, папку для размещения сохраняемого файла и формат, а затем дайте имя сохраняемому файлу и просто нажмите на кнопку Save.

Важно: В случае, если вы хотите сохранить изображение выделенных блоков в файл, в диалоговом окне Сохранить изображение как активизируйте опцию Сохранять выделенные блоки.

Важно: Вы имеете возможность сохранить несколько изображений в один файл как многостраничный TIF. Для этого выделите необходимые вам изображения в диалоговом окне Пакет, из меню Файл выберите команду Сохранить изображение как, в раскрывшемся диалоговом окне выберите формат TIF и активизируйте опцию Сохранять все страницы в один файл.