Глава 2. Обработка сканированных изображений для использования в различных системах САПР и ГИС
Глава 2.
Обработка сканированных изображений для использования в различных системах САПР и ГИС
Векторизация есть процесс, требующий обязательного участия человека, поскольку только человек, глядя на черные и белые точки на экране (а результат сканирования — это черные и белые точки), может окончательно решить, что является дорогой, что рекой, что взлетно-посадочной полосой, а что отдельно стоящим домом. Любой самый умный векторизатор является только инструментом, который позволяет быстро генерировать по группам черных точек линии, окружности, тексты, а не рисовать все это заново, как это делается с использованием дигитайзеров. При векторизации оператор должен разбираться в предметной области и понимать, что собственно он векторизует — машиностроительный чертеж, карту или электрическую схему, иначе количество ошибок может оказаться слишком большим.
Кроме процесса векторизации, надо выделить процесс подготовки отсканированного материала к дальнейшей работе. Сюда входит процесс чистки грязи (мелких пятнышек, почти неизбежно появляющихся в процессе сканирования), повороты на малые углы (требующиеся в результате перекоса бумаги), линейная и нелинейная калибровки растрового изображения (требующиеся при деформациях бумаги), различные алгоритмы фильтрации — утоныпение и утолщение линий, разделение близко стоящих линий.
Заметим, что в результате этого процесса получается довольно качественное растровое изображение, которое вполне может быть помещено в электронный архив. Легенда о больших объемах растровых изображений не выдерживает критики. Современные форматы хранения монохромных растровых документов (вчастности, TIFF Groupe IV) настолько плотны, что вполне сравнимы по объемам с векторными форматами. Это не касается цветных форматов, которые достаточно объемны.
И еще одно замечание. Существуют гибридные методы работы с растровыми документами, когда пользователь одновременно работает и с растровым, и с векторным изображением, наложенными друг на друга, и может их одновременно видеть, масштабировать, редактировать, выводить на твердую копию. Когда вам на плане этажа формата АО надо перепланировать одну комнату (скажем, 5%), подумайте, надо ли вам векторизовать весь план. Или же проще перерисовать 5% и вывести все вместе на плоттер.
Фактически все программные средства, обеспечивающие создание электронных архивов и все системы документооборота, имеют встроенные средства (или позволяют подключить внешние) для работы со сканированными документами в самых разнообразных форматах. О важности этого также говорит тот факт, что AutoCAD имеет встроенные средства для работы со сканированными изображениями и гибридной графикой.
Во-вторых, произошел серьезнейший сдвиг в отношении цветных сканированных изображений. С одной стороны, их объемы остаются очень большими, но развитие технических средств уже позволяет нормально с ними работать. Сдругой стороны, для многих промышленных применений цветные сканированные изображения по-прежнему не нужны. С третьей стороны, крупноформатные промышленные сканеры стоят очень дорого, но сканеры формата А4 уже распространены повсюду. Так или иначе, но сегодня фактически все пакеты, имеющие отношение к рассматриваемой тематике, обеспечивают работу с цветными сканированными изображениями, по крайней мере как с фоновой подложкой. Это касается и AutoCAD, и целого ряда программ просмотра документов, входящих в состав электронных архивов, и пакетов обработки сканированных изображений.
Кроме того, родилась технология автоматического разделения по слоям цветных сканированных изображений по критерию цвета и работы с каждым цветом в дальнейшем как с монохромным изображением. Эта технология, видимо, будет иметь очень большие перспективы при доведении ее до практического применения, особенно в картографии, ГИС и обработке цветных чертежей (правда, вРоссии их фактически нет).
В-третьих, уже упоминавшаяся технология гибридной работы со сканированными документами (в первую очередь чертежами) становится стандартом при обработке накопленных архивов чертежей. Используя сканирование, уже упоминавшуюся технологию подготовки растрового чертежа, гибридное редактирование и вывод на струйный плоттер, можно фактически по мятой, жеваной синьке в приемлемые сроки восстановить «белок» чертежа, при этом гарантированно не потеряв информации, которая легко может быть потеряна при повальной векторизации или «сколки» чертежа заново.
Лидером среди программных средств в этой области по-прежнему является комплекс программ компании Consistent Software, имеющий общее название Raster ARTS. В него входят следующие программы:
• SpotLIGHT и SpotLIGHT PRO.
• Vectory.
• RasterDESK и RASTERDESK PRO.
• RasterDESK LT и RASTERDESK LT PRO.
Идеологически все эти программы очень близки и отличаются средой функционирования и функциональной наполненностью:
• Spotlight, Spotlight Pro и Vectory являются независимыми программами и функционируют в среде Windows.
• Rasterdesk и Rasterdesk PRO функционируют в среде AutoCAD в Windows.
• Rasterdesk LT и Rasterdesk LT PRO функционируют в среде AutoCAD LT.
По функциональной насыщенности программы подразделяются следующим образом:
• Spotlight, RasterDESK и RasterDESK LT обеспечивают работу срастровыми файлами (калибровка, фильтрация, чистка файла иредактирование), трассировку и ручную векторизацию, преобразование векторных данных в растровые.
• Vectory обеспечивает автоматизированную векторизацию растровых графических документов, включая распознавание различных графических объектов (отрезки, дуги, полилинии, размерные линии, линии разных типов), текстов и поддерживает достаточно тонкую настройку алгоритмов распознавания.
• Spotlight PRO, RasterDESK PRO и RasterDESK LT PRO дополнительно обеспечивают алгоритмы автоматизированной векторизации и Color-процессор для «расслоевки» цветных растровых изображений на монохромные.
Теперь подробнее рассмотрим, что нового с функциональной точки зрения включено в программы серии RASTER ARTS.
Новые возможности:
Растровые слои
• Объектные методы растровой селекции.
• Color Image Processor для «расслаивания» цветных изображений.
• Библиотеки растровой, векторной и гибридной графики.
• Улучшенные алгоритмы векторизации.
• Распознавание текста.
• Поддержка TWAIN-сканеров.
Возможности растрового редактирования
• Выбор растровых данных, аналогичный выбору векторных объектов AutoCAD.
• Сохранение любой части растрового изображения в отдельный файл.
• Вращение, масштабирование, перемещение, удаление, выравнивание и дублирование фрагментов растрового изображения.
• Рисование и стирание точек с заданной толщиной.
• Поворот растрового изображения с целью горизонтального или вертикального выравнивания растровых объектов.
• Удаление малоразмерных растровых объектов — растрового «мусора» и заливка отверстий в растровых линиях с автоматической оценкой размера «мусора» и отверстий.
• Фильтрация растрового изображения с использованием различных видов матричных фильтров: медианного, утоныпающего, утолщающего, инверсного.
• Новая процедура калибровки растрового изображения сиспользованием набора методов трансформации.
• Создание библиотек растровой графики.
• Копирование и вставка неограниченного числа фрагментов растровой графики с использованием одновременно нескольких библиотек RasterDesk.
• Растеризация векторных объектов.
Возможности интерактивной векторизации (трассировки)
• Трассировка отрезков, дуг и кругов с автоматическим определением типа объекта.
• Трассировка растровых объектов заданного типа (по шаблону).
• Трассировка штриховок.
• Трассировка произвольных растровых кривых полилиниями (Linefollow).
• В процессе трассировки имеется возможность:
• Округлить толщины векторных объектов по заданным значениям;
• Разнести создаваемые векторные объекты различной толщины по слоям AutoCAD;
• Игнорировать разрывы линий и дуг растрового изображения.
Возможности автоматической векторизации (только в Pro версии)
• Распознавание отрезков, кругов, дуг и штриховок.
• Распознавание текстов (OCR).
• Возможность обучения OCR распознаванию новых символов.
• Аппроксимация произвольных кривых полилиниями.
• Аппроксимация контуров площадных растровых объектов.
• Распознавание типа линии объектов.
• Распознавание стрелок на отрезках и дугах.
• Возможность принудительного выравнивания прямых линий к правильным углам.
• Округление толщин векторных объектов по заданным значениям.
• Возможность игнорировать при векторизации разрывы линий и дуг растрового изображения.
• Автоматическая коррекция результатов распознавания: сопряжение дуг и отрезков, сведение концов векторных объектов.
• Возможность отдельно векторизовать участок растрового изображения произвольной формы.
• Настройка распознавания с использованием стандартных наборов параметров.
Наиболее полнофункциональным средством остается SpotLIGHT PRO nRasterDESK PRO. Пакет RasterDESK LT PRO является наиболее выгодным средством для пользователей, достаточно регулярно работающих с растровой промышленной графикой.
Около семидесяти процентов мирового рынка занято широкоформатными сканерами производства CalComp, Contex, Vidar. Заметим, что сканеры CalComp и Contex отличаются друг от друга только торговыми марками. До последнего времени основные модели CalComp и Vidar имели схожие внешние спецификации и одинаковые на российском рынке цены. Такое сходство цен определяется не западными поставщиками, а политикой российского дистрибьютера Consistent Software. У CalComp имеются модели с разрешением 1000 dpi и выше, у Vidar — TruScan Flash с разрешением 1600 dpi, однако не совсем понятна «экологическая» ниша этих моделей, поскольку сканирование чертежей не требует высокого разрешения, картографов обычно удовлетворяет разрешение 400-800 dpi, для обработки результатов аэрофотосъемки разрешения TruScan Flash или подобных моделей CalComp все равно недостаточно. Отметим также модель CalComp S3-300, с разрешением 300 dpi, наиболее дешевую до последнего времени, но не достаточную даже для «грязных» чертежей.
Существует ряд критериев, по которым разумно производить выбор сканера для САПР и ГИС:
• во-первых, сканер должен быть широкоформатным — для работы сболыпими чертежами (можно использовать сканеры меньших форматов — А4, A3, но в этом случае придется решать сложную задачу соединения отдельных сканированных фрагментов документа в единое целое, что требует специального программного обеспечения, высоких профессиональных навыков оператора и значительного времени. Таким образом, экономия средств на широкоформатном сканере оборачивается потерями производительности и качества полученных электронных документов, что, в конечном итоге, значительно перекрывает стоимость такого сканера);
• во-вторых, давать минимальную погрешность в размерах получаемого изображения по отношению к исходному, что очень важно при использовании размеров на электронном документе для различных расчетов;
• в-третьих, иметь встроенные программно-аппаратные средства для улучшения качества получаемого изображения — автоматическую очистку изображения от неравномерности фона («грязи») исходного бумажного документа, повышение яркости иконтрастности изображения;
• в-четвертых, разрешающая способность должна быть достаточной для получения высококачественных твердых копий документов по их изображениям;
• в-пятых, сканер должен одинаково хорошо работать с документами на различных типах носителей — бумага тонкая и «толстая», калька, лавсановая пленка;
• в-шестых, качество носителя не должно решающим образом влиять на качество получаемого изображения;
• в-седьмых, производительность сканера должна быть достаточно высокой при приемлемом качестве изображения;
• в-восьмых, установка носителя в сканере должна быть максимально простой и исключать ошибки при сканировании из-за неправильной заправки носителя.
В результате непосредственного сравнения и проведения ряда тестов смоделями Contex FS-32600 (CalComp S3-600) и Vidar TruScan 600 были сделаны следующие выводы:
• Contex дает большую погрешность при сканировании (отметим, что в подавляющем большинстве случаев вполне приемлемую);
• Vidar TruScan дает возможность сканировать более тонкие, толстые и ветхие носители, что достигается прямым трактом протяжки носителя и большим зазором (0,75 мм у Contex и 2 мм у Vidar).
Остальные параметры Contex FS и Vidar TruScan мало отличаются друг отдруга.
За последнее время у Vidar появилась модель Vidar TruScan Select. Это первый в мире широкоформатный сканер имеющий возможность модификации (Upgrade). Базовая модель TruScan Select имеет оптическую (она же и программная) разрешающую способность 400 dpi и возможность расширения до 600 и 800 dpi. Vidar TruScan Select обладает некоторыми другими новыми и весьма ценными свойствами: появилась новая модификация с зазором 3 мм, позволяющая сканировать толстые материалы, например дюралюминиевые планшеты, применяемые в картографии; увеличилась скорость сканирования.