Глава 21. Омнифонтовая OCR-система
Глава 21.
Омнифонтовая OCR-система
Программа FineReader является так называемой омнифонтовой системой оптического распознавания текстов. Подобные системы дают возможность распознавать печатные тексты, набранные шрифтами с различными гарнитурами.
Основные возможности
Программа FineReader:
• Дает возможность ввести документ в компьютер посредством нажатия всего на одну кнопку.
• Имеется возможность экспортировать распознанный текст в текстовый редактор или электронную таблицу, а также сохранить его в формате PDF или HTML.
• Имеется возможность сохранять цвета распознанного текста в форматах RTF, PDF и HTML.
• Встроенная технология «адаптивного распознавания»: Необычайно высокая точность распознанных текстов и малая чувствительность к дефектам печати.
• Распознанные страницы представляются миниатюрными изображениями.
• Имеется возможность сканировать разворот книги и распознавать ее каждую страницу по отдельности, при этом, изображение, содержащее сдвоенные страницы, сохраняется в две различные страницы пакета.
• Встроенный алгоритм автоматического поиска блоков (участков изображения, выделенных в рамку) распознаваемого текста: Анализ отсканированного материала и его распознавание происходит одновременно.
• Программа «видит» изображения в распознаваемом макете.
• 176 языков распознавания.
• Распознавание языков программирования (Basic, Cobol, Fortran, Java, C++, Pascal).
• Распознавание подстрочных символов и вертикального текста.
• Поддержка кодировки Unicode при сохранении распознанного текста в форматах RTF, DOC, XLS, HTML, TXT и CSV.
Форматы текстовых файлов, которые поддерживает программа
FineReader может экспортировать распознанный материал в одном из следующих форматов:
• Microsoft Word Document (*.DOC).
• Rich Text Format (*.RTF).
• Adobe Acrobat Format (*.PDF)
• HTML.
• Comma Separated Values File (*.CSV).
• Простой текст (*.TXT).
• Microsoft Excel Speadsheet (*.XLS).
• DBF.
Форматы графических файлов, которые поддерживает программа
FineReader позволяет импортировать в свою систему файлы следующих форматов:
• TIFF.
• BMP.
• JPEG.
• PCX
• DCX.
• PNG.
Для работы с русскоязычной версией программы операционная система Microsoft Windows должна поддерживать русскоязычную раскладку клавиатуры (доступ в Microsoft Windows Me Millennium Edition: Панель управления к Язык и стандарты к Региональные стандарты к Язык к Русский к Страна/Регион к Россия).