Глава 32. Распознавание
Глава 32.
Распознавание
Задача распознавания состоит в том с тем, чтобы преобразовать отсканированное изображение в текст, сохранив при этом оформление страницы. Прежде чем приступить к распознаванию текста, необходимо установить основные параметры распознавания: язык распознавания, тип печати распознанного текста и тип страницы.
Важно: Перед запуском распознавания проверьте установленные опции: язык распознавания, тип печати распознаваемого текста и тип страницы.
Вы имеете возможность:
• Распознать блок или несколько блоков, выделенных на изображении.
• Распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет.
• Распознать все нераспознанные страницы пакета.
• Распознать все страницы в фоновом режиме. В этом режиме возможно распознавание с одновременным редактированием уже распознанных страниц.
• Распознать страницы в режиме распознавание с обучением. Данный режим используется в основном для распознавания текстов, использующих декоративные шрифты, или распознавания большого объема (более 100 страниц) документов плохого качества печати.
• Распознать страницы одного пакета на нескольких компьютерах одновременно.
Запуск распознавания
Нажмите на кнопку 2-Распознать на панели Scan and Read. Из меню Процесс выберите необходимую команду:
• Распознать — чтобы распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет;
• Распознать все — чтобы распознать все нераспознанные страницы пакета;
• Распознать Блок — чтобы распознать блок или несколько блоков, выделенных на изображении;
• Запустить фоновое распознавание — чтобы запустить распознавание в фоновом режиме.
Кнопка 2-Распознать запускает распознавание открытого изображения. Для того, чтобы изменить режим кнопки, нажмите на стрелку справа от нее и из открывшегося меню выберите необходимую команду.
Важно: В процессе распознавания уже распознанной страницы перераспознаются только отредактированные и добавленные блоки.
Язык распознавания
FineReader поддерживает распознавание как одноязычных, так и многоязычных (например, английско-французских) документов.
Для того, чтобы указать язык распознаваемого текста, выберите соответствующую строку в списке на панели Распознавание.
В случае, если вы хотите распознать документ, написанный на нескольких языках:
В списке языков на панели Стандартная выберите команду Выбор нескольких языков… в раскрывшемся диалоговом окне Язык распознаваемого текста укажите несколько языков. Для этого активизируйте опции с соответствующими названиями языков.
Важно: В случае, если вы часто используете какую-либо комбинацию языков, то создайте новую группу, содержащую эти языки (возможно только в версии FineReader Office).
Важно: Увеличение количества подключенных к распознаванию одного документа языков может привести к ухудшению качества распознавания. Не рекомендуется подключать более 2-3 языков.
Перед запуском распознавания проверьте подключенные на закладке Форматирование шрифты: они должны содержать все символы языка распознавания. В противном случае распознанный текст будет неправильно отображен в диалоговом окне Текст (в словах на месте некоторых букв стоят значки "?").
В случае, если необходимый язык отсутствует в списке, то возможны следующие варианты:
• Данный язык не поддерживается системой FineReader.
• Язык исключен из списка языков отображаемых на панели Стандартная. В этом случае в списке языков на панели Стандартная выберите команду Выбор из полного списка языков и в раскрывшемся диалоговом окне Язык распознаваемого текста укажите необходимый язык.
• Язык не был установлен (была выбрана минимальная установка) или был отключен при выборочной установке. Для того, чтобы доустановить языки распознавания, запустите программу инсталляции FineReader в режиме покомпонентной установки (Установка дистрибутива по выбору), дезактивируйте все опции, за исключением опции Языки распознавания, и просто нажмите на кнопку Состав. В раскрывшемся списке языков укажите требуемые языки.
Важно: В процессе установке проверьте, что вы указали ту же папку, в которую вы ранее установили ABBYY FineReader.
Как подключить язык к списку отображаемых языков
В диалоговом окне Редактор языков (доступ: Сервис к Редактор языков) выберите язык, который вы хотите подключить, и дезактивируйте опцию Показывать в списке языков.
Важно: Вы имеете возможность установить язык распознавания на отдельный блок. Для этого нажмите правой кнопкой мыши на блоке, для которого вы хотите установить язык распознавания, отличный от языка распознавания для всего текста, и из меню выберите команду Свойства. В раскрывшемся диалоговом окне Свойства на закладке Блок в поле Язык распознавания выберите язык распознавания выделенного блока.
Тип печати входного текста
Для большинства текстов тип печати определяется автоматически. Этому соответствует значение Авто (доступ: раздел Тип печати, меню Сервис к Опции, закладка Распознавание).
В процессе распознавания текстов, напечатанных на матричном принтере в черновом режиме или на пишущей машинке, можно добиться более высокого качества распознавания, установив правильный Тип печати: для текстов, набранных на пишущей машинке — значение Пишущая машинка. для текстов, напечатанных на матричном принтере — значение Матричный принтер.
Как поменять тип печати
На закладке Распознавание диалогового окна Опции (доступ: Сервис к Опции) из раздела Тип печати выберите нужную опцию.
Важно: После распознавания текстов, набранных на пишущей машинке или матричном принтере, не забудьте снова выбрать значение Авто при возвращении к типографскому тексту.
Другие опции распознавания
Показывать или не показывать изображение при распознавании
Распознавание группы страниц происходит быстрее, если обрабатываемое изображение не отображается.
На закладке Общие (доступ: Сервис к Общие) дезактивируйте опцию Показывать изображение при распознавании.
Инвертировать блок
Для того, чтобы распознать инвертированные участки изображений (текстовый блок, ячейки таблицы или всю таблицу целиком) нажмите правой кнопкой мыши на инвертированном блоке и из меню выберите команду Свойства. В раскрывшемся диалоговом окне Свойства блока активизируйте опцию Инвертированный.
Распознавание в фоновом режиме
В случае, если вы хотите одновременно с распознаванием редактировать распознанные страницы, вы имеете возможность запустить распознавание в фоновом режиме: из меню Процесс выберите команду Запустить фоновое распознавание.
В строке состояния появится значок. В случае, если для диалогового окна Пакет вами выбран режим показа свойства страниц (доступ: Вид к Вид со свойствами), то напротив распознаваемой страницы в колонке Открыта появится специальный значок. В этом режиме распозна вание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.
Как остановить распознавание в фоновом режиме
Из меню Процесс выберите команду Остановить фоновое распознавание.
Важно: В программе abbyy finereader в режиме Распознавание в фоновом режиме используются опции, установленные в программе до запуска фонового распознавания.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Распознавание речи
Распознавание речи Интересная системная утилита, с помощью которой можно распознавать речь и переводить ее в текст. К сожалению, поддерживается работа только с английским
Глава 9 Сканирование, распознавание и конвертирование с помощью ABBYY FineReader
Глава 9 Сканирование, распознавание и конвертирование с помощью ABBYY FineReader В процессе написания работы вам наверняка будут встречаться тексты или рисунки из книг и журнальных статей, которые необходимо поместить в документ. Если вы планируете использовать лишь фрагмент,
Распознавание типов
Распознавание типов Статический метод TheMachine.FireThisPerson() строился так, чтобы он мог принимать любой тип, производный от Employee, но возникает один вопрос: как метод "узнает", какой именно производный тип передается методу. Кроме того, если поступивший параметр имеет тип Employee, то
Часть 1. Сканирование и распознавание
Часть 1. Сканирование и распознавание Глава 1. Как работает сканирующее устройство В процессе ввода изображения в компьютер в первую очередь необходимо преобразовать его в последовательность электрических сигналов. Для этого используются так называемые
Глава 24. Распознавание в программе FineReader
Глава 24. Распознавание в программе FineReader Распознавание в программе FineReader осуществляется в так называемом пакетном режиме. В ABBYY FineReader пакет — это папка, в которой находятся изображения и рабочие файлы программы. После того, как вы отсканируете изображение оно сохранится
FineReader – распознавание текста
FineReader – распознавание текста Ввести со сканера текст в компьютер – задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл – обычную картинку. Отсюда возникают
Сканирование и распознавание
Сканирование и распознавание Ввести со сканера текст в компьютер – задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл – обычную картинку. Отсюда возникают
Глава 8 Сканирование, распознавание и конвертирование с помощью ABBYY FineReader
Глава 8 Сканирование, распознавание и конвертирование с помощью ABBYY FineReader В процессе написания работы вам наверняка будут встречаться тексты или рисунки из книг и журнальных статей, которые вам захочется поместить в свой документ. Если вы планируете использовать
ПИСЬМОНОСЕЦ: Распознавание опечатков
ПИСЬМОНОСЕЦ: Распознавание опечатков Автор: Владимир ГуриевДо первого апреля еще далеко, но посмешить народ уже хочется. Так попробуем же…Думаю, редакция «Терры» прекрасно знает, как мы доверяем нашему любимому журналу. И по этому поводу у меня возникла одна мысль: а что,
Распознавание вида компонент
Распознавание вида компонент Компоненты x и y объявлены как относящиеся к типу REAL без ассоциированного алгоритма, следовательно, они являются атрибутами. Все остальные компоненты содержат конструкции видаisdo... Инструкции ...endкоторые описывают алгоритм, что является
"Яндекс" вложился в распознавание лиц Юрий Ильин
"Яндекс" вложился в распознавание лиц Юрий Ильин ОпубликованоЮрий Ильин Компания «Яндекс» впервые инвестировала в иностранную компанию, причём занимающуюся весьма перспективным направлением деятельности — распознаванием лиц на цифровых
Распознавание лица
Распознавание лица В отличие от других систем биометрической идентификации, распознавание лица носит пассивный характер: оно может осуществляться без ведома человека, позволяя производить идентификацию в лифте или при проходе через дверь. Сегодня биометрические
ГЛАВА 1
ГЛАВА 1 Глава, самая первая, в которой мальчик Алёша получает в подарок котёнка, знакомится с удивительным человечком Точкой и отправляется в Компьютерный Город. Алёша не спеша возвращался из школы домой. Шарф — в портфеле, шапка — в кармане куртки. Весна.Что ты больше
ГЛАВА 2
ГЛАВА 2 Глава, в которой Котёнок начинает разговаривать, Точка катает гостей на своём электромобиле, а ровно в 16.40 начинается дождь. Раздался щелчок. Свет внезапно погас. Алёша, Котёнок и Точка очутились в кромешной темноте.— Не бойтесь. Сейчас глаза привыкнут, и мы пойдём