§ 1. Классификация и кодирование картографической информации
§ 1. Классификация и кодирование картографической информации
При разработке ИО ключевое значение приобретает проблема классификации и кодирования элементов картографической информации. Не имея надежной системы классификации и кодирования, нельзя эффективно решать вопросы стандартизации цифровых данных, сокращения объемов данных, рациональной организации массивов, эффективного управления базами данных, информационной безопасности.
Под классификацией понимается совокупность правил распределения заданного множества картографических объектов на подмножества в соответствии с установленными признаками их сходства или различия. Цель кодирования состоит в том, чтобы представить картографическую информацию в цифровом виде в более компактной и удобной форме, которая позволит обеспечить решение задач в ГИС.
Порядок и правила кодирования картографических элементов устанавливаются системой кодирования. Совокупность условных обозначений, построенная по определенной системе кодирования, называется кодом.
В широком смысле слова коды можно определить как систему условных обозначений. При создании информационного обеспечения ГИС большое внимание уделяется построению кодов, которые используются для обозначения картографических элементов.
Перечень всех позиций (элементов) какой-либо совокупности, равнозначных в отношении друг к другу и упорядоченных в рамках перечня, составляет номенклатуру признака, например, номенклатуру картографических элементов гидрографии, значений количественных характеристик объектов местности и др.
При машинной обработке данных каждая позиция номенклатуры должна быть представлена в виде кодового обозначения, кодового слова, а номенклатура в целом — в виде кода.
Необходимость эффективного кодирования возрастает по мере развития ГИС и ее приложений к АСУ. Правильно и рационально построенные коды в значительной степени влияют на эффективность ГИС.
Применение кодов существенно облегчает группировку информации, ее поиск в базах данных, анализ ее содержания и вообще использование при решении пользовательских задач.
Значение правильно разработанных кодов особенно возрастает в условиях создания автоматизированных систем управления и единого банка картографических данных. Применение картографической информации в различных по назначению АСУ требует унификации и согласования всех применяемых классификаций в единую систему кодирования картографических данных, которая явится составной частью информационного обеспечения ГИС и информационного обеспечения АСУ в целом.
На практике сложились следующие системы кодирования: порядковая, серийная, разрядная, система повторения и комбинированная.
Порядковая система применяется для кодирования однопризначных, устойчивых и простых характеристик: категорий дорог, рек, видов картографических объектов, значений высот, глубин, единиц измерений и др.
Серийная система служит для кодирования двухпризначных характеристик, например, виды покрытия дорог, типы лесов и т. п.
Разрядная (позиционная) система применяется для кодирования сложных объектов. При этой системе каждому классификационному признаку отводится определенное число разрядов, которое зависит от количества предметов кодируемого множества. В основе любой разрядной системы лежит иерархическая классификация, которая рассматривается как семантическая система. Она базируется на разделении всех признаков на взаимоисключающие друг друга группы по классификационным признакам до самого нижнего уровня. Наиболее сложным при разработке системы классификации является выбор признаков классификации и определение порядка их следования. В процессе создания классификации выполняется анализ всех признаков объектов и выделяются наиболее информативные признаки из общей совокупности, имеющей наибольшую вероятность распределения с учетом их весовых характеристик, исходя из назначения ГИС, характера решаемых задач и других.
Крайне важно определить, что положить в основу классификации на нижнем уровне. Анализ картографических данных показывает, что в качестве такого уровня можно предложить понятие картографического объекта или элементарного объекта, являющегося минимальной единицей картографических данных.
Построение кода по разрядной системе позволяет выделить каждый классификационный признак, обеспечить стройность и логичность всей системы, удобства машинной обработки информации. Недостаток разрядной системы в том, что при незначительном превышении емкости разряда приходится увеличивать разрядность кода. Разрядная система используется для кодирования признаков картографических объектов как элементарных объектов.
При кодировании по системе повторения в коды позиций включаются цифровые или буквенные обозначения, непосредственно характеризующие данный картографический объект (значение высоты, ширины дороги и т. д.).
При комбинированной системе осуществляется кодирование одновременно по нескольким вышеупомянутым системам. Ввиду многопризначности картографических объектов при их кодировании целесообразно использовать комбинированную систему кодирования.
Выбор системы кодирования зависит от ряда факторов и, прежде всего, от числа позиций группы и классов картографических объектов, степени их устойчивости, системы записи на машинных носителях и др. В принципе, система кодирования должна соответствовать количественной мере информации, содержащейся во всей совокупности картографических объектов. В этом смысле оптимальной будет та система кодирования, в которой разрядность кодов будет определяться величиной энтропии картографических объектов.
Поэтому разработке системы кодирования предшествует большой объем работ по классификации картографических объектов.
Исходным и очень важным при проектировании кодов является определение перечня всех подлежащих кодированию картографических объектов и их количественные характеристики. Эта работа проводится на стадии обследования картографических объектов в результате изучения первичной информации об объектах местности (топографические карты, фотоматериалы, описание местности, нормативные документы и т. д.).
Исчерпывающие данные об объектах местности позволяют установить перечень позиций по признаку объекта, данных о его местоположении и количественных характеристик самого объекта. Такую систематизацию выполняют специалисты различных топографических специальностей.
При систематизации объектов классифицируемого множества выбирают наиболее важные основания классификации, определяют комплекс классификаторов, для каждого из которых устанавливается сфера его действия.
Классификатор представляет собой некоторый документ, который отображает закон разбиения множества картографических объектов на группы, классы, подклассы и т. д. и позволяющий одновременно производить кодирование признаков объектов.
После систематизации объектов выбирается определенная система кодирования и каждому признаку объекта присваивается кодовое обозначение. Затем осуществляется проверка правильности кодирования, устранение замеченных недостатков и оформление кодов в виде таблиц, справочников и альбомов, которые рассылаются во все производственные предприятия.
Кроме того, производится разработка положений о внесении изменений и дополнений, определяются лица (подразделения), ответственные за внесение различных изменений в систему условных обозначений и доведение изменений до соответствующих подразделений (потребителей), разрабатываются инструкции пользования классификационными справочниками и кодами.
При построении кодов учитывается ряд требований. Прежде всего, коды должны включать все картографические объекты. Длина кода должна учитывать возможность расширения списка объектов без нарушения целостности принятой системы кодирования. Коды должны быть минимальными по разрядности. Это уменьшает трудоемкость процесса обработки и его контроль, сокращает объемы памяти на машинных носителях.
При кодировании должно обеспечиваться удобство обмена информацией и ее машинной обработки. Для обеспечения высокой достоверности сбора, передачи и обработки информации в коде может предусматриваться включение контрольных разрядов. Коды должны также обеспечивать автоматическое обнаружение ошибок и их коррекцию.
В настоящее время при проектировании ГИС в каждом отдельном случае используются свои коды объектов. Однако имеются некоторые общие подходы, которые состоят в следующем.
При систематизации объектов критерием объединения их классификации в отдельные группы служит степень связанности их информационных показателей — признаков, характеризующих объекты. Это обеспечивает размещение каждого объекта в соответствии с его значением на определенном уровне в общей логической структуре.
На нижнем уровне классификации принимают элементарный объект, классификационный код которого определяется ведущим признаком. Вместе с этим, каждый элементарный объект содержит определенный набор характеризующих его признаков, которые не могут быть использованы в качестве признаков классификации. Их число и смысловое значение зависит от конкретного объекта. Совокупность указанных признаков условно можно разделить на признаки, содержащие данные о местоположении объектов, и признаки, определяющие количественное значение измеренных или вычисленных величин о свойствах объекта. Данные о местоположении (метрические) включают значения, по которым легко определяются положения объекта непосредственно на местности в виде плановых координат (геодезических и прямоугольных) и его высоты.
Характеристики объекта составляют признаки, по которым восстанавливаются данные о типе объекта (линейно протяженный, площадной или компактно расположенный, точечный) и его материальные свойства.
Кодирование классификационных признаков производится с использованием позиционной системы.
В то же время, при кодировании признаков характеристик объектов используются порядковая или серийная системы, а при кодировании количественных и качественных значений самих признаков и местоположения объекта используется система повторений. Выбор системы кодирования зависит от значений признаков конкретного объекта.
В настоящее время во многих ГИС принята система классификации, имеющая 8 разрядную систему признаков, в которой первый разряд обозначает группу, второй и третий — класс, четвертый и пятый — подкласс, шестой — тип, седьмой и восьмой — вид.
К группам относятся следующие картографические объекты:
• математические элементы, элементы плановой и высотной основы;
• рельеф суши;
• гидрография и гидротехнические сооружения;
• населенные пункты;
• промышленные, сельскохозяйственные и социально-культурные;
• дорожная сеть и дорожные сооружения;
• растительный покров и грунты;
• границы, ограждения и отдельные природные явления.
Дополнительной группой являются объекты «Подписи на картах».
В основу классификации характеристик объектов положен принцип объединения признаков, характеризующих смысловое значение конкретных физических свойств отдельных картографических объектов. Характеризующие признаки определяются их смысловым значением, соответствующим количественной стороне объекта. При кодировании признака, характеризующего объект в количественном аспекте, в кодовое описание объекта включается непосредственное значение количественной характеристики (высота, глубина и т. п.).
При разработке системы кодирования конкретной ГИС необходимо также учитывать способность кодов определять и исправлять ошибки, возникающие в результате процесса обработки и передачи данных по каналам связи. Особенно это важно в условиях преднамеренного информационного противоборства.