Глава 2. Обработка сканированных изображений для использования в различных системах САПР и ГИС

Глава 2.

Обработка сканированных изображений для использования в различных системах САПР и ГИС

Векторизация есть процесс, требующий обязательного участия человека, поскольку только человек, глядя на черные и белые точки на экране (а результат сканирования — это черные и белые точки), может окончательно решить, что является дорогой, что рекой, что взлетно-посадочной полосой, а что отдельно стоящим домом. Любой самый умный векторизатор является только инструментом, который позволяет быстро генерировать по группам черных точек линии, окружности, тексты, а не рисовать все это заново, как это делается с использованием дигитайзеров. При векторизации оператор должен разбираться в предметной области и понимать, что собственно он векторизует — машиностроительный чертеж, карту или электрическую схему, иначе количество ошибок может оказаться слишком большим.

Кроме процесса векторизации, надо выделить процесс подготовки отсканированного материала к дальнейшей работе. Сюда входит процесс чистки грязи (мелких пятнышек, почти неизбежно появляющихся в процессе сканирования), повороты на малые углы (требующиеся в результате перекоса бумаги), линейная и нелинейная калибровки растрового изображения (требующиеся при деформациях бумаги), различные алгоритмы фильтрации — утоныпение и утолщение линий, разделение близко стоящих линий.

Заметим, что в результате этого процесса получается довольно качественное растровое изображение, которое вполне может быть помещено в электронный архив. Легенда о больших объемах растровых изображений не выдерживает критики. Современные форматы хранения монохромных растровых документов (вчастности, TIFF Groupe IV) настолько плотны, что вполне сравнимы по объемам с векторными форматами. Это не касается цветных форматов, которые достаточно объемны.

И еще одно замечание. Существуют гибридные методы работы с растровыми документами, когда пользователь одновременно работает и с растровым, и с векторным изображением, наложенными друг на друга, и может их одновременно видеть, масштабировать, редактировать, выводить на твердую копию. Когда вам на плане этажа формата АО надо перепланировать одну комнату (скажем, 5%), подумайте, надо ли вам векторизовать весь план. Или же проще перерисовать 5% и вывести все вместе на плоттер.

Фактически все программные средства, обеспечивающие создание электронных архивов и все системы документооборота, имеют встроенные средства (или позволяют подключить внешние) для работы со сканированными документами в самых разнообразных форматах. О важности этого также говорит тот факт, что AutoCAD имеет встроенные средства для работы со сканированными изображениями и гибридной графикой.

Во-вторых, произошел серьезнейший сдвиг в отношении цветных сканированных изображений. С одной стороны, их объемы остаются очень большими, но развитие технических средств уже позволяет нормально с ними работать. Сдругой стороны, для многих промышленных применений цветные сканированные изображения по-прежнему не нужны. С третьей стороны, крупноформатные промышленные сканеры стоят очень дорого, но сканеры формата А4 уже распространены повсюду. Так или иначе, но сегодня фактически все пакеты, имеющие отношение к рассматриваемой тематике, обеспечивают работу с цветными сканированными изображениями, по крайней мере как с фоновой подложкой. Это касается и AutoCAD, и целого ряда программ просмотра документов, входящих в состав электронных архивов, и пакетов обработки сканированных изображений.

Кроме того, родилась технология автоматического разделения по слоям цветных сканированных изображений по критерию цвета и работы с каждым цветом в дальнейшем как с монохромным изображением. Эта технология, видимо, будет иметь очень большие перспективы при доведении ее до практического применения, особенно в картографии, ГИС и обработке цветных чертежей (правда, вРоссии их фактически нет).

В-третьих, уже упоминавшаяся технология гибридной работы со сканированными документами (в первую очередь чертежами) становится стандартом при обработке накопленных архивов чертежей. Используя сканирование, уже упоминавшуюся технологию подготовки растрового чертежа, гибридное редактирование и вывод на струйный плоттер, можно фактически по мятой, жеваной синьке в приемлемые сроки восстановить «белок» чертежа, при этом гарантированно не потеряв информации, которая легко может быть потеряна при повальной векторизации или «сколки» чертежа заново.

Лидером среди программных средств в этой области по-прежнему является комплекс программ компании Consistent Software, имеющий общее название Raster ARTS. В него входят следующие программы:

• SpotLIGHT и SpotLIGHT PRO.

• Vectory.

• RasterDESK и RASTERDESK PRO.

• RasterDESK LT и RASTERDESK LT PRO.

Идеологически все эти программы очень близки и отличаются средой функционирования и функциональной наполненностью:

• Spotlight, Spotlight Pro и Vectory являются независимыми программами и функционируют в среде Windows.

• Rasterdesk и Rasterdesk PRO функционируют в среде AutoCAD в Windows.

• Rasterdesk LT и Rasterdesk LT PRO функционируют в среде AutoCAD LT.

По функциональной насыщенности программы подразделяются следующим образом:

• Spotlight, RasterDESK и RasterDESK LT обеспечивают работу срастровыми файлами (калибровка, фильтрация, чистка файла иредактирование), трассировку и ручную векторизацию, преобразование векторных данных в растровые.

• Vectory обеспечивает автоматизированную векторизацию растровых графических документов, включая распознавание различных графических объектов (отрезки, дуги, полилинии, размерные линии, линии разных типов), текстов и поддерживает достаточно тонкую настройку алгоритмов распознавания.

• Spotlight PRO, RasterDESK PRO и RasterDESK LT PRO дополнительно обеспечивают алгоритмы автоматизированной векторизации и Color-процессор для «расслоевки» цветных растровых изображений на монохромные.

Теперь подробнее рассмотрим, что нового с функциональной точки зрения включено в программы серии RASTER ARTS.

Новые возможности:

Растровые слои

• Объектные методы растровой селекции.

• Color Image Processor для «расслаивания» цветных изображений.

• Библиотеки растровой, векторной и гибридной графики.

• Улучшенные алгоритмы векторизации.

• Распознавание текста.

• Поддержка TWAIN-сканеров.

Возможности растрового редактирования

• Выбор растровых данных, аналогичный выбору векторных объектов AutoCAD.

• Сохранение любой части растрового изображения в отдельный файл.

• Вращение, масштабирование, перемещение, удаление, выравнивание и дублирование фрагментов растрового изображения.

• Рисование и стирание точек с заданной толщиной.

• Поворот растрового изображения с целью горизонтального или вертикального выравнивания растровых объектов.

• Удаление малоразмерных растровых объектов — растрового «мусора» и заливка отверстий в растровых линиях с автоматической оценкой размера «мусора» и отверстий.

• Фильтрация растрового изображения с использованием различных видов матричных фильтров: медианного, утоныпающего, утолщающего, инверсного.

• Новая процедура калибровки растрового изображения сиспользованием набора методов трансформации.

• Создание библиотек растровой графики.

• Копирование и вставка неограниченного числа фрагментов растровой графики с использованием одновременно нескольких библиотек RasterDesk.

• Растеризация векторных объектов.

Возможности интерактивной векторизации (трассировки)

• Трассировка отрезков, дуг и кругов с автоматическим определением типа объекта.

• Трассировка растровых объектов заданного типа (по шаблону).

• Трассировка штриховок.

• Трассировка произвольных растровых кривых полилиниями (Linefollow).

• В процессе трассировки имеется возможность:

• Округлить толщины векторных объектов по заданным значениям;

• Разнести создаваемые векторные объекты различной толщины по слоям AutoCAD;

• Игнорировать разрывы линий и дуг растрового изображения.

Возможности автоматической векторизации (только в Pro версии)

• Распознавание отрезков, кругов, дуг и штриховок.

• Распознавание текстов (OCR).

• Возможность обучения OCR распознаванию новых символов.

• Аппроксимация произвольных кривых полилиниями.

• Аппроксимация контуров площадных растровых объектов.

• Распознавание типа линии объектов.

• Распознавание стрелок на отрезках и дугах.

• Возможность принудительного выравнивания прямых линий к правильным углам.

• Округление толщин векторных объектов по заданным значениям.

• Возможность игнорировать при векторизации разрывы линий и дуг растрового изображения.

• Автоматическая коррекция результатов распознавания: сопряжение дуг и отрезков, сведение концов векторных объектов.

• Возможность отдельно векторизовать участок растрового изображения произвольной формы.

• Настройка распознавания с использованием стандартных наборов параметров.

Наиболее полнофункциональным средством остается SpotLIGHT PRO nRasterDESK PRO. Пакет RasterDESK LT PRO является наиболее выгодным средством для пользователей, достаточно регулярно работающих с растровой промышленной графикой.

Около семидесяти процентов мирового рынка занято широкоформатными сканерами производства CalComp, Contex, Vidar. Заметим, что сканеры CalComp и Contex отличаются друг от друга только торговыми марками. До последнего времени основные модели CalComp и Vidar имели схожие внешние спецификации и одинаковые на российском рынке цены. Такое сходство цен определяется не западными поставщиками, а политикой российского дистрибьютера Consistent Software. У CalComp имеются модели с разрешением 1000 dpi и выше, у Vidar — TruScan Flash с разрешением 1600 dpi, однако не совсем понятна «экологическая» ниша этих моделей, поскольку сканирование чертежей не требует высокого разрешения, картографов обычно удовлетворяет разрешение 400-800 dpi, для обработки результатов аэрофотосъемки разрешения TruScan Flash или подобных моделей CalComp все равно недостаточно. Отметим также модель CalComp S3-300, с разрешением 300 dpi, наиболее дешевую до последнего времени, но не достаточную даже для «грязных» чертежей.

Существует ряд критериев, по которым разумно производить выбор сканера для САПР и ГИС:

• во-первых, сканер должен быть широкоформатным — для работы сболыпими чертежами (можно использовать сканеры меньших форматов — А4, A3, но в этом случае придется решать сложную задачу соединения отдельных сканированных фрагментов документа в единое целое, что требует специального программного обеспечения, высоких профессиональных навыков оператора и значительного времени. Таким образом, экономия средств на широкоформатном сканере оборачивается потерями производительности и качества полученных электронных документов, что, в конечном итоге, значительно перекрывает стоимость такого сканера);

• во-вторых, давать минимальную погрешность в размерах получаемого изображения по отношению к исходному, что очень важно при использовании размеров на электронном документе для различных расчетов;

• в-третьих, иметь встроенные программно-аппаратные средства для улучшения качества получаемого изображения — автоматическую очистку изображения от неравномерности фона («грязи») исходного бумажного документа, повышение яркости иконтрастности изображения;

• в-четвертых, разрешающая способность должна быть достаточной для получения высококачественных твердых копий документов по их изображениям;

• в-пятых, сканер должен одинаково хорошо работать с документами на различных типах носителей — бумага тонкая и «толстая», калька, лавсановая пленка;

• в-шестых, качество носителя не должно решающим образом влиять на качество получаемого изображения;

• в-седьмых, производительность сканера должна быть достаточно высокой при приемлемом качестве изображения;

• в-восьмых, установка носителя в сканере должна быть максимально простой и исключать ошибки при сканировании из-за неправильной заправки носителя.

В результате непосредственного сравнения и проведения ряда тестов смоделями Contex FS-32600 (CalComp S3-600) и Vidar TruScan 600 были сделаны следующие выводы:

• Contex дает большую погрешность при сканировании (отметим, что в подавляющем большинстве случаев вполне приемлемую);

• Vidar TruScan дает возможность сканировать более тонкие, толстые и ветхие носители, что достигается прямым трактом протяжки носителя и большим зазором (0,75 мм у Contex и 2 мм у Vidar).

Остальные параметры Contex FS и Vidar TruScan мало отличаются друг отдруга.

За последнее время у Vidar появилась модель Vidar TruScan Select. Это первый в мире широкоформатный сканер имеющий возможность модификации (Upgrade). Базовая модель TruScan Select имеет оптическую (она же и программная) разрешающую способность 400 dpi и возможность расширения до 600 и 800 dpi. Vidar TruScan Select обладает некоторыми другими новыми и весьма ценными свойствами: появилась новая модификация с зазором 3 мм, позволяющая сканировать толстые материалы, например дюралюминиевые планшеты, применяемые в картографии; увеличилась скорость сканирования.