Глава 3. Обработка сканированных изображений для использования в различных ГИС
Глава 3.
Обработка сканированных изображений для использования в различных ГИС
• Обработка цветных и полутоновых сканированных изображений в промышленных секторах рынка занимает весьма малый процент в общем объеме запросов на обработку сканированных изображений (не более 5-8%). Это замечание, естественно, не касается автоматизации издательских и полиграфических работ, но этот сектор рынка не лежит в сфере интересов САПР и ГИС. Отметим некоторые особенности задач обработки цветных и полутоновых сканированных изображений: очень высокая стоимость промышленных цветных сканеров; высокие требования к объемам памяти — формат А4 с 256 градациями цвета и разрешением 300 точек на дюйм по самым скромным оценкам занимает 8,5 Мбайт, а для нормальной обработки требуется много больше;
• Ограниченный набор функций по их векторизации и невысокая их надежность.
Комплексы программ для обработки монохромных сканированных изображений занимают до 95% этого сектора рынка.
Одной из таких программ является CAD Overlay, появившаяся еще в 1990 году. Несмотря на очень слабые функциональные возможности, в те времена это была единственная доступная программа в этом секторе рынка.
Большим шагом в развитие этой программы стало появление CAD Overlay ESP, в которую были внесены возможность редактирования растрового изображения, вывод гибридного (то есть совместного растрового и векторного) изображения на твердые копии и функция «Разумный растр».
Под этим названием скрывается механизм «растровой» привязки, аналогичный механизму объектной привязки в AutoCAD, возможность автоматического стирания растровых объектов, поверх которых происходит рисование векторных примитивов и «растеризация» (то есть перевод в растровый вид) векторных примитивов. Из всего вышеперечисленного принципиальное значение имеет только «Растровая привязка». Стирание растровых объектов производится некорректно, поскольку при этом используется некоторая «средняя» толщина линии, ане производится анализ связной растровой области. В результате этого после стирания остаются растровые «ошметки», которые надо удалять вручную. «Растеризация» векторных примитивов является побочным эффектом гибридной технологии и особого интереса не представляет.
Наибольшим достижением CAD Overlay ESP явилась гибридная работа, позволяющая не проводить векторизацию неизмененных областей чертежей и карт. CAD Overlay ESP функционирует в среде AutoCAD, что сделало его популярным среди пользователей. В то же время, жесткая привязка CAD Overlay ESP к AutoCAD сужает применимость данной системы.
Отметим, что с момента выхода CAD Overlay
ESP под маркой IMAGE Systems и до настоящего времени (сегодня CAD Overlay ESP распространяется под маркой SOFTDESK) никакого существенного развития функциональных возможностей, к сожалению, не произошло. Появившийся недавно пакет CAD
Overlay LFX, предназначенный для автоматизированной трассировки линий, путается в двух пересекающихся линиях и никакой критики не выдерживает.
• Был проведен анализ программ обработки сканированных изображений, предлагаемых сегодня на российском рынке. В качестве основных критериев выбора использовались: способность программ работать с большими объемами растровых изображений с приемлемым временем реакции; способность программ работать с современными форматами, обеспечивающими максимальное компрессирование изображений, в частности с форматом TIFF Group 4, обеспечивающим по нашим экспериментам максимальное сжатие; максимальную функциональную полноту рассматриваемых программ — подготовка растрового изображения, трассировка, автоматическая векторизация, гибридное редактирование; использование современных технологий программирования иработы с расширенной памятью компьютера.
Проводился анализ следующих программ: CAD Overlay Classic, CAD Overlay ESP, ВЕКТОР, BEKTOMETP, EASE-TRACE, SpotLight, Vertory, SpotLight PRO и ряд других. Пакеты Rastation R2V и RxVectory, RAStation EDIT и RxSpotLight, фактически являются OEM-продуктами компании Consistent Software, что свидетельствует о высоком качестве и международном признании этих программ. Весь анализ проводился на базе картографических материалов в масштабе 1:2000.
Большинство российских разработчиков не в состоянии работать с большими объемами информации (в основном это связано с тем, что программы не используют «верхнюю» память) и современными форматами хранения растровых данных.
Наиболее функционально полон пакет SpotLight/PRO, несомненно являющийся лидером среди всех рассматриваемых пакетов. SpotLight/PRO реализован как 32-разрядный пакет, функционирующий в среде Windows, что делает его независимым от применяемой пользователем ГИС или CAD-системы. Пакеты SpotLight и Vectory, из которых, собственно, и родился SpotLight/PRO, фактически являются функционально урезанными частями, в первом из которых акцентирована работа с растровыми изображениями и трассировка, а во втором делается акцент на автоматическую векторизацию.
• Рассмотрим возможности пакета SpotLight/PRO. Все его характеристики можно условно классифицировать следующим образом: чтение и подготовка сканированного растрового изображения; редактирование растрового изображения; автоматизированная трассировка растрового изображения; автоматическая векторизация растрового изображения; редактирование векторного изображения; запись растрового и векторного изображений; оперативные возможности.
Чтение и подготовка сканированного растрового изображения
SpotLight/Pro позволяет работать со следующими растровыми форматами: RLC, TIFF разных форматов, включая CCITT Group 4, PCX, CALS, BMP, RLP. После проведения сканирования бумажного материала обычно необходимо подготовить растровое изображение к дальнейшей работе. В это понятие включается: удаление малоразмерных растровых объектов — «мусора», поворот (в том числе и на малые углы — до 10 градусов), масштабирование по одной или обеим осям, линейные и нелинейные трансформации растрового изображения (довольно редкая для этого класса программ возможность), фильтрация растрового изображения (например, для разделения сливающихся линий, удаления разрывов). Заметим, что все эти действия могут быть применены как для всего изображения, так и для отдельных его фрагментов.
Редактирование растрового изображения
Редактирование растрового изображения включает в себя рисование и стирание с заданной шириной пера и/или резинки, выбор фрагмента прямоугольной и/или произвольной многоугольной формы и операции с ними — копирование, перенос, «растеризация» векторного фрагмента — то есть запись его в растровое изображение.
Автоматизированная трассировка растрового изображения
Эта возможность позволяет пользователю производить «автоматизированную» векторизацию растровых объектов — пользователь указывает на объект и SpotLight/PRO пытается его автоматически трассировать. Например, при трассировке полилиний программа останавливается, наткнувшись на неразрешаемое пересечение или разрыв линии, и запрашивает пользователя о дальнейших действиях. Возможна трассировка отрезков, дуг, окружностей, штриховок, полилиний. При трассировке можно задавать округление ширин растровых объектов кзаданным значениям и величину игнорируемого разрыва линий и дуг. Также возможно автоматическое удаление оттрассированных растровых объектов (удаляются связные растровые области).
Автоматическая векторизация растрового изображения
Качество векторизации определяется количеством распознаваемых растровых объектов. SpotLight/Pro автоматически распознает отрезки, окружности, дуги, полилинии, контура площадных растровых объектов, различные типы линий, стрелки на отрезках и дугах. При этом можно задать размеры игнорируемых разрывов линий и дуг, округление ширин к заданным величинам. Автоматически производится локализация растровых текстов, коррекция результатов распознавания — сопряжение дуг и отрезков, сведение концов векторных объектов, выравнивание отрезков прямых к правильным углам. В SpotLight/Pro реализована процедура поиска растровых объектов по образцу, которая позволяет удалять и заменять произвольные растровые объекты на векторные символы. Тексты могут быть векторизованы обводными линиями, линиями по центру либо не векторизованы вообще. Возможно маскирование текстовых и других объектов, не подлежащих векторизации.
Редактирование векторного изображения
Эта возможность включает рисование отрезков, окружностей, дуг, полилиний, полимаркеров, создание текстов с использованием шрифтов AutoCAD и/или TrueType-шрифтов, вставка форм AutoCAD, использование линий различных типов, удаление, растягивание, перенос и поворот объектов, использование объектной и растровой привязки, точная коррекция параметров векторных объектов, размещение векторных объектов по слоям в зависимости от ширины.
Запись растрового и векторного изображения
Отредактированный растровый файл может быть записан в любой из вышеперечисленных растровых форматов, векторный файл может быть сохранен в любом из следующих форматов: DXB, DXF, DWG (AutoCAD), форматы CADDY (ASC и PIC) и собственный формат VC4 (поставляется приложение к AutoCAD, обеспечивающее работу с этим форматом).
Оперативные возможности
В эту группу входят возможность сборки растрового изображения из различных файлов, возможность разбивки растрового изображения на файлы, работа с растровыми, векторными и гибридными фрагментами, возможность пакетной векторизации и фильтрации растровых файлов, средство «птичий глаз», настройка векторизации с использованием стандартных наборов параметров, выбор пользовательской системы координат, а также возможность вывода гибридных изображений на твердые копии.
Аппаратура
Кроме проблемы выбора ПО для обработки сканированных изображений, у пользователей обычно стоит и проблема выбора оборудования для сканирования чертежей. Когда решается задача выбора оборудования, всегда ищется некий оптимум между приемлемой ценой и функциональностью приобретаемого оборудования. Самый дешевый вариант — купить монохромный сканер формата А4. Сканируемый материал разбивается на части, а затем «склеивается». Такой вариант может быть использован в учебных целях, однако на практике при большом объеме сканируемого материала трудозатраты на склеивание и устранение возникающих при этом искажений сделают процесс нереализуемым.
На первый взгляд заманчиво выглядит вариант приобретения плоттера со сканирующей головкой (СГ). СГ устанавливается на перьевые плоттеры DMP и HiPlot, производства SummaGraphics, вместо пишущего узла. Применение СГ имеет ряд существенных недостатков, доставшихся по наследству от плоттера. Эти плотеры весьма требователены к бумажному носителю, а сканируемый материал чаще всего находится на ветхих кальках, синьках, ватманах. Для работы с таким материалом его нужно предварительно поместить в специальный пластиковый пакет. Скорость сканирования на плотерах практически на порядок меньше, чем на широкоформатном сканере. Процесс юстировки сканирующей головки после каждой ее установки также достаточно трудоемок.
Единственным разумным способом создания объемного электронного архива сканированных чертежей, схем и других графических материалов является приобретение широкоформатного сканера формата АО.
Рынок широкоформатных сканеров сравнительно невелик, на нем присутствуют компании Intergraph, CalComp, CONTEX, VIDAR. Однако массовый потребитель практически лишен и этого выбора. Intergraph и CalComp (особенно первый) имеют столь высокую цену, что попадают в поле зрения потенциального пользователя только для обоснования цены перед начальством. Выбор между CONTEX и VIDAR также в большинстве случаев оканчивается в пользу VIDAR, поскольку продукция этих фирм обладает близкими техническими параметрами, а цена у VIDAR на 15-20% ниже, чем у CONTEX.
Отметим, что у CONTEX существуют модели, которых нет у VIDAR. Это сканер формата A3, с разрешением 800 dpi. К сожалению, на рынке отсутствует сканер формата A3 с разрешением 300 dpi, потребность в котором явно ощущается. У CONTEX есть модель FS3200 формата АО с разрешением 300 dpi, однако ее цена вполне сопоставима с VIDAR TruScan500, тогда, как технические параметры VIDAR TruScan500 существенно превосходят CONTEX FS3200.
Наиболее популярной моделью является VIDAR TruScan600. В отличие от TruScan500, модель 600 обладает функцией автоматического выравнивания фона, что позволяет избежать многократного сканирования для настройки порогового значения фона, соответственно, результирующая скорость сканирования у модели 600 существенно выше.
Для сканирования цветных изображений формата АО единственной доступной моделью является VIDAR TruScan CS400.
Осталось отметить, что обработка сканированных изображений — это не наука, а искусство, и при любом уровне автоматизации этого процесса вам всегда останется возможность поработать руками.