Глава 19. Системы распознавания текстов в офисе
Глава 19.
Системы распознавания текстов в офисе
Основное назначение пакетов оптического распознавания символов (Optical Character Recognition, OCR) состоит в анализе растровой информации (отсканированного символа) и присвоении точечному изображению символа фиксированного электронного значения. Грубо говоря, OCR-система определяет, какой букве соответствует та или иная картинка.
Отечественные разработчики программного обеспечения действительно преуспели в сфере систем распознавания. Между тем проблемы, которые встают перед разработчиками подобных систем, весьма нетривиальны. В зависимости от качества отсканированного изображения приходится разделять склеившиеся символы, домысливать творения матричного принтера, разбивать (фрагментировать) текст на блоки, догадываться о значении не пропечатавшихся символов, настраиваться (через систему обучения) на «почерк» печатающего устройства или пишущей машинки, узнавать широкую гамму шрифтов, начертаний и других параметров символов. Кроме того, современные системы оптического распознавания должны уметь сохранять форматирование исходных документов, присваивать в нужном месте атрибут абзаца, сохранять таблицы, оставлять в покое графику (нераспознаваемые картинки)…
И это лишь малая толика всех задач OCR— пакетов. Из не решенных на сегодняшний день проблем остается уверенное распознавание «вольных» рукописных текстов или декоративных шрифтов. По сложности эта задача приближается к речевому распознаванию. Тем не менее Cognitive Forms (Cognitive Technologies) и FineReader 4.0 Forms (ABBYY) уже уверенно распознают машинописные записи в формулярах (анкетах, декларациях и т.д.). Не так давно появились примеры решений для автоматизации форм, вручную заполняемых пользователями в специально отведенных блоках для букв. Отчасти это напоминает строку для индекса на почтовых конвертах (только без пунктиров), однако распознавание при этом заметно сложнее из-за многообразия индивидуальных «граффити», далеких от принципов классической каллиграфии. Этот класс систем — тема для отдельного разговора, так как они достаточно специфичны и сложны.
OCR-системы — редкий пример офисных программ, реализующих почти весь потенциал высокопроизводительных процессоров. Скорость распознавания имеет прямую зависимость от архитектуры процессора, тактовой частоты и наличия усиленного блока целочисленных вычислений (мультимедийных расширений). Не случайно на коробках большинства OCR-программ красуется надпись Designed for Intel ММХ. Считается, что расширения Intel для оптимизации целочисленных вычислений позволяют повысить скорость распознавания на треть.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
8.9.12 Отсутствие распознавания медленных и быстрых связей
8.9.12 Отсутствие распознавания медленных и быстрых связей Сетевой администратор может вручную присвоить для связи значение счетчика попаданий. Следовательно, для связи "точка-точка" со скоростью 9,6 Кбайт/с можно установить значение счетчика 5, что укажет на ее меньшие
Система распознавания 3D-моделей
Система распознавания 3D-моделей Огромное значение для любой системы трехмерного твердотельного моделирования имеет возможность обмена данными с другими САПР, используемыми предприятиями-заказчиками. Некоторые машиностроительные компании при проектировании и
Перевод текстов
Перевод текстов Как мы уже отмечали ранее, удаленные переводчики также являются потенциальными жертвами мошенников. При этом схема обмана может выглядеть примерно так, как и в ситуации с набором текстов. Ниже мы приводим конкретный пример объявления, которое дали
Глава 20 Эргономика в офисе
Глава 20 Эргономика в офисе Вопросами гигиены труда в настоящее время в нашей стране практически никто не занимается. Следовательно, нужно позаботиться об этом самим. От правильно организованного рабочего места зависит ваше здоровье и самочувствие. Мало того, по мнению
Глава 10. Реализация распознавания жестов
Глава 10. Реализация распознавания жестов 10.0. Введение Жест (Gesture) — это комбинация событий касания. Жесты применяются, например, в стандартном приложении Photo (Фото) для iOS. В этой программе пользователь может увеличивать или уменьшать фотографию, двигая двумя пальцами в
Глава 29. Процесс сканирования и распознавания печатного материала
Глава 29. Процесс сканирования и распознавания печатного материала • В программе ABBYY FineReader имеется специальная кнопка Scan and Read, которая дает возможность произвести полную обработку текста: отсканировать. распознать. проверить. сохранить результаты распознавания. После
Глава 37. Экспорт результатов распознавания во внешние приложения
Глава 37. Экспорт результатов распознавания во внешние приложения Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск, скопировать в буфер обмена или отправить по электронной почте. Сохранить можно все страницы или только
Часть IV Ubuntu в офисе
Часть IV Ubuntu в офисе Четвертая часть книги посвящена офисному использованию Ubuntu. Мы подробно рассмотрим основные приложения офисного пакета OpenOffice.org (Writer, Calc и Impress), а также настроим принтер в
Стена из Lego в швейцарском офисе Google в зависимости от освещения показывает разных героев «Звёздных войн» Николай Маслухин
Стена из Lego в швейцарском офисе Google в зависимости от освещения показывает разных героев «Звёздных войн» Николай Маслухин Опубликовано 15 октября 2013 Google по праву считается одним из лучших работодателей в мире. Немалый вклад в это достижение вносят
«У нас в офисе бардак и очень шумно»
«У нас в офисе бардак и очень шумно» Стандартные действия:• Попробуйте создать более благоприятную атмосферу или перевезите команду на другое место. Куда угодно. Можете снять комнату в отеле (см. стр. 43 «Как мы обустроили комнату команды»).• Если это возможно, попросите
Печать текстов
Печать текстов В настоящее время распечатка набранного текста на принтере стала достаточно простой операцией. Если у вас в системе установлен принтер и вы настроили его драйвер, то никаких проблем с распечаткой документов у вас возникнуть не должно. Просто выберите
6. Синтез текстов.
6. Синтез текстов. С проблемами поиска релевантного знания и понимания текстов весьма тесно соприкасается еще одна проблема, привлекающая сейчас внимание специалистов, работающих в ИИ. Она связана с разгадкой механизмов, лежащих в основе процедур порождения текстов на