BC/NW 2006, №2, (9) :12.1
ОНТОЛОГИЧЕСКАЯ КЛАССИФИКАЦИЯ ДОКУМЕНТОВ
Белова М.С., Крюков А.Ф., Мещанинов Д.Г.
(Москва, Московский энергетический институт
(технический университет), Россия)
Традиционный подход к
документообороту рассматривает делопроизводственную сторону без рассмотрения
специфических свойств и поведения документов, присущих их виду и контексту
использования. Весьма актуальна задача разработки моделей, методов и
программного обеспечения, позволяющих учесть существенные свойства и поведение
документов (их онтологию), проявляемые ими во взаимосвязи с множеством
различных объектов учёта, процессов обработки и участников. Рассматриваемая
задача обусловлена множественной онтологической классификацией документов и
новыми методами её решения такими как применение концептуального
метамоделирования в рамках объектной парадигмы.
Рассмотрим
произвольное конечное множество документов , где .
Будем называть множество - множеством объектов, а номер элемента – идентификатором объекта [1].
Элементы
множества описываются дискретными признаками .
Каждый признак характеризуется множеством числовых или качественных значений , - номер значения признака , а - мощность множества значений признака (), - номер признака.
Значения
признаков можно представить -мерным
пространством:
…
Каждый объект из множества можно представить как точку в -мерном
пространстве , и
поставить каждому объекту в соответствие значение функции от -аргументов
.
Заметим, что значение функции может быть одинаковым для нескольких объектов, в
том случае, если набор значений признаков будет совпадать, т.е. одна и та же
точка в -мерном
пространстве будет соответствовать нескольким разным
элементам множества .
Необходимо
выделить все возможные множества, каждое из которых характеризуется наличием у
входящих в него объектов определенных признаков и их значений, т.е. в
соответствии со значением функции или по каким-то другим отличительным
характеристикам, которые невозможно описать числовыми или качественными
значениями, например, по внешнему виду.
Разбить
множество объектов на подмножества можно в соответствии с
основаниями деления (в рамках терминов используемых в данной работе основание
деление можно назвать аспектом) . В
соответствии с каждым аспектом (где )
можно выделить множество классов , на
которые можно разделить множество объектов. После выделения множества классов в
соответствии с каждым аспектом, получается -мерное
пространство:
…
,
где - множество классов (где - индекс, идентифицирующий класс на множестве , - мощность множества ),
которые получились в результате деления множества объектов в соответствии с аспектом .
Вектор назовем классификационной группировкой.
В соответствии
со значением функции от аргументов
,
которым характеризует объект, а также в соответствии с характеристиками,
которые невозможно описать числовыми или качественными значениями, элемент можно представить как точку в -мерном
пространстве .
Объекту в соответствие можно поставить значение функции от -аргументов
, где , …, - индекс, идентифицирующий класс внутри одной
классификационной группы.
Рассмотрим
множество классов - классификационную группировку. Такое
множество является частично упорядоченным множеством, то есть на данном
множестве задано отношение частичного порядка между элементами [1]. Отношение
частичного порядка обладает свойствами рефлексивности, транзитивности и
антисимметричности.
Рефлексивность
означает, что любой элемент множества находится в отношении с самим собой.
Формальная запись свойства рефлексивности отношения £ выглядит следующим образом:
,
где .
Свойство транзитивности
указывает на то, что если существует цепочка из (трех) элементов, связанных
отношением £, то первый и последний
элементы этой цепочки можно связать тем же отношением. Это свойство гарантирует
построение графа отношения частичного порядка на множестве в виде «решетки».
Формальная запись свойства транзитивности для отношения £ выглядит следующим образом:
.
Антисимметричность
– свойство, которое разрешает наследование только в одном направлении и
запрещает его в противоположном направлении. Формальная запись свойства
антисимметричности для отношения £ выглядит следующим образом:
.
Для
формализации модели наследования использована диаграмма Хассе. На диаграмме
Хассе точками или кружками представляются элементы множества, причем если , то
элемент располагается ниже элемента , при
этом элементы соединяются линией, если не существует другого элемента ,
такого, что и .
Приведем пример диаграммы Хассе для представления отношения включения
(характерное отношения частичного порядка) на множестве всех подмножеств .
Рассмотрим
модель наследования на простом примере классификации множества документов.
Множество документов можно разбить на подмножества в соответствии с аспектом
«Назначение документа». В соответствии с выбранным аспектом образуется
классификационная группировка ={Организационный,
Распорядительный, Нормативный}. Расширим множества классов данной группировки.
Организационные документы делятся на уставы, положения, руководства,
инструкции. В свою очередь инструкции делятся на должностные инструкции,
инструкции по эксплуатации систем оборудования, производственные инструкции.
Ниже представлена диаграмма Хассе для классификационной группировки .
В результате получена
математическая модель схемы классификации объектов, основными элементами
которой являются множество объектов ;
множество признаков, которыми характеризуется объект - ;
множество аспектов в соответствии с которыми образуются частично
упорядоченные множества классов - классификационные группировки. На множестве с помощью отношения частичного порядка
описывается наследственная связь между элементами множества.
Полученная
модель применена для реализации комплекса классификации документов для системы
электронного документооборота в соответствии с алгоритмом последовательности
действий построения схемы классификации.
ЛИТЕРАТУРА
1. Фролов А.Б.,
Андреев А.Е., Болотов А.А., Коляда К.В. Прикладные задачи дискретной математики
и сложность алгоритмов. М.: МЭИ, 1997. – 312 с.