Linux и OCR – братья на век
Linux и OCR – братья на век
LinuxFormat, #144 (май 2011)
До недавнего времени Linux не мог похвастаться эффективными средствами для распознавания текстов: резонные люди рекомендовали прибегать к связке из FineReader+Wine.
Да и задача эта не выглядела актуальной: мне казалось, что большая часть «старого» контента уже оцифрована, а новый только в цифровой форме и создаётся. Однако по мере развития своих гуманитарных проектов (геологическго и исторического) я убедился, что был не прав: существует море «неокученных» старых материалов по этой теме. А материалы новые часто легче оцифровать с печатных версий, чем получить «файлы-исходники»: увы, один за другим уходят мамонты советской геологии.
Но действительности со свободными средствами распознавания оказалось «всё не так суицидально, ежли в корень посмотреть»: в 2008 году были открыты исходники OCR Cuneiform, которые тут же портировались на Linux и FreeBSD.
Правда, прямое применение Cuneiform к свежесканированным страницам производило удручающее впечатление. Однако дело оказалось легко поправимо благодаря программам:
• Scan Tailor (разработка Иосифа Арцимовича) – она выполняет предварительную коррекцию отсканированного документа, и
• YAGF (создана Андреем Боровским) – это интегрирующая графическая оболочка для Cuneiform, упрощающая её использование и расширяющая возможности.
Связка из этих трёх инструментов даёт результат хотя и не идеальный, но более чем приемлемый. И результат этот можно видеть на сайтах Памяти Советской геологии и Гиштория.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
IPLabs Linux Team: начало русского Linux’а
IPLabs Linux Team: начало русского Linux’а Следующая веха на пути русского Linux’а – 1998 год, когда фирма IPLabs (точнее, ее подразделение – IPLabs Linux Team) совместно с Институтом логики (на самом деле это были одни и те же люди – Алексей Новодворский, Алексей Смирнов и Юрий Девяткин с
SUSE Linux
SUSE Linux Это наиболее популярная версия операционной системы Linux, выпускающейся компанией Novell. Данная ОС рассчитана на разные категории пользователей: от новичков, которые ждут от операционной системы не только простоты в установке, использовании, устойчивости в работе и
Mandriva Linux
Mandriva Linux Автором этого программного продукта является французско-бразильская компания Mandriva, образованная после слияния компаний Mandrake и Connectiva. Эта операционная система поддерживает двухъядерные 64-битные процессоры. В состав системы входят такие приложения, как Firefox, GCC,
1.5.1. Red Hat Linux
1.5.1. Red Hat Linux Данный дистрибутив считается классическим и является законодателем моды в развитии ОС, потому что именно в этой фирме работает основатель Linux — Линус Торвальдс. Для получения этого дистрибутива вы можете купить коробочный вариант или скачать версию
Серверы POP для Linux
Серверы POP для Linux Серверы POP входят в состав практически каждого дистрибутивного пакета Linux. Как правило, самым простым решением является использование сервера, поставляемого вместе с системой, но если вы перенастроите сервер SMTP для хранения писем в другом формате, вам,
Для пользователей Linux
Для пользователей Linux Инструкция для пользователей Linux (от Incanter)1. На сайте https://www.torproject.org/projects/torbrowser.html.en берем нужную локализацию Tor, учитывая разрядность системы (32- или 64-битная).Например, если требуется 64-битная русская версия, идем
Для пользователей Linux Инструкция для пользователей Linux (от Incanter)
Для пользователей Linux Инструкция для пользователей Linux (от Incanter) 1. Проверяем наличие java, если она отсутствует, устанавливаем: Рис. 902. Чтобы сборка i2p под Linux всегда была чистой и свежей, идем на http://code.google.com/p/i2p и стягиваем оттуда jar-архив Рис. 913. Запускаем консоль,
1.2. О Linux
1.2. О Linux История операционной системы Linux началась, естественно, с создания операционной системы Unix. В конце 60-х годов завершился проект Multics, над которым работали сотрудники компаний General Electrics, AT&T Bell Laboratories и Массачусетского института. Результатом этого проекта стала
3.2.8. Linux
3.2.8. Linux Операционная система Linux, созданная Линусом Торвальдсом в 1991 году, лидирует среди Unix-систем новой школы с открытым исходным кодом, появившихся в 1990 году (в их число также входит FreeBSD, NetBSD, OpenBSD и Darwin), и представляет направление конструирования, принятое данной
3.2.8. Linux
3.2.8. Linux Операционная система Linux, созданная Линусом Торвальдсом в 1991 году, лидирует среди Unix-систем новой школы с открытым исходным кодом, появившихся в 1990 году (в их число также входит FreeBSD, NetBSD, OpenBSD и Darwin), и представляет направление конструирования, принятое данной
Братья-лузеры, проект бородатой балерины, влияние Юпитера и спасательный круг Традиции Сергей Голубицкий
Братья-лузеры, проект бородатой балерины, влияние Юпитера и спасательный круг Традиции Сергей Голубицкий Опубликовано 06 марта 2014 деле прослеживаются признаки глобального вырождения нашей цивилизации? Не буду, впрочем, ничего читателям с ходу
Linux
Linux Созданная в 1992 году программистом-любителем Линусом Торвальдсом, эта операционная система отличается от всех существующих.Во-первых, Linux имеет открытый программный код, то есть распространяется бесплатно. Любой пользователь, знакомый с программированием, может
LINUX
LINUX В конце 1980-х и начале 1990-х я затратил много времени, программируя «Макинтоши», и в конечном счете решил выделить несколько сотен баксов на «яблочный» продукт, названный «Мастерская Программиста Макинтошей», или MPW (сокр. от «Macintosh Programmers Workshop» — прим. перев.). У MPW были