Глава 21. Омнифонтовая OCR-система

Глава 21.

Омнифонтовая OCR-система

Программа FineReader является так называемой омнифонтовой системой оптического распознавания текстов. Подобные системы дают возможность распознавать печатные тексты, набранные шрифтами с различными гарнитурами.

Основные возможности

Программа FineReader:

• Дает возможность ввести документ в компьютер посредством нажатия всего на одну кнопку.

• Имеется возможность экспортировать распознанный текст в текстовый редактор или электронную таблицу, а также сохранить его в формате PDF или HTML.

• Имеется возможность сохранять цвета распознанного текста в форматах RTF, PDF и HTML.

• Встроенная технология «адаптивного распознавания»: Необычайно высокая точность распознанных текстов и малая чувствительность к дефектам печати.

• Распознанные страницы представляются миниатюрными изображениями.

• Имеется возможность сканировать разворот книги и распознавать ее каждую страницу по отдельности, при этом, изображение, содержащее сдвоенные страницы, сохраняется в две различные страницы пакета.

• Встроенный алгоритм автоматического поиска блоков (участков изображения, выделенных в рамку) распознаваемого текста: Анализ отсканированного материала и его распознавание происходит одновременно.

• Программа «видит» изображения в распознаваемом макете.

• 176 языков распознавания.

• Распознавание языков программирования (Basic, Cobol, Fortran, Java, C++, Pascal).

• Распознавание подстрочных символов и вертикального текста.

• Поддержка кодировки Unicode при сохранении распознанного текста в форматах RTF, DOC, XLS, HTML, TXT и CSV.

Форматы текстовых файлов, которые поддерживает программа

FineReader может экспортировать распознанный материал в одном из следующих форматов:

• Microsoft Word Document (*.DOC).

• Rich Text Format (*.RTF).

• Adobe Acrobat Format (*.PDF)

• HTML.

• Comma Separated Values File (*.CSV).

• Простой текст (*.TXT).

• Microsoft Excel Speadsheet (*.XLS).

• DBF.

Форматы графических файлов, которые поддерживает программа

FineReader позволяет импортировать в свою систему файлы следующих форматов:

• TIFF.

• BMP.

• JPEG.

• PCX

• DCX.

• PNG.

Для работы с русскоязычной версией программы операционная система Microsoft Windows должна поддерживать русскоязычную раскладку клавиатуры (доступ в Microsoft Windows Me Millennium Edition: Панель управления к Язык и стандарты к Региональные стандарты к Язык к Русский к Страна/Регион к Россия).