BC/NW 2006, №2, (9) :12.1

 

ОНТОЛОГИЧЕСКАЯ КЛАССИФИКАЦИЯ ДОКУМЕНТОВ

 

Белова М.С., Крюков А.Ф., Мещанинов Д.Г.

 

(Москва, Московский энергетический институт (технический университет), Россия)

            Традиционный подход к документообороту рассматривает делопроизводственную сторону без рассмотрения специфических свойств и поведения документов, присущих их виду и контексту использования. Весьма актуальна задача разработки моделей, методов и программного обеспечения, позволяющих учесть существенные свойства и поведение документов (их онтологию), проявляемые ими во взаимосвязи с множеством различных объектов учёта, процессов обработки и участников. Рассматриваемая задача обусловлена множественной онтологической классификацией документов и новыми методами её решения такими как применение концептуального метамоделирования в рамках объектной парадигмы.

Рассмотрим произвольное конечное множество документов , где . Будем называть множество  - множеством объектов, а номер  элемента – идентификатором объекта [1].

Элементы множества  описываются  дискретными признаками . Каждый признак характеризуется множеством числовых или качественных значений ,  - номер значения признака , а  - мощность множества значений признака (),  - номер признака.

Значения признаков можно представить -мерным пространством:

Каждый объект  из множества  можно представить как точку  в -мерном пространстве , и поставить каждому объекту  в соответствие значение функции от -аргументов . Заметим, что значение функции может быть одинаковым для нескольких объектов, в том случае, если набор значений признаков будет совпадать, т.е. одна и та же точка в -мерном пространстве  будет соответствовать нескольким разным элементам множества .

Необходимо выделить все возможные множества, каждое из которых характеризуется наличием у входящих в него объектов определенных признаков и их значений, т.е. в соответствии со значением функции  или по каким-то другим отличительным характеристикам, которые невозможно описать числовыми или качественными значениями, например, по внешнему виду.

Разбить множество объектов  на подмножества можно в соответствии с основаниями деления (в рамках терминов используемых в данной работе основание деление можно назвать аспектом) . В соответствии с каждым аспектом  (где ) можно выделить множество классов , на которые можно разделить множество объектов. После выделения множества классов в соответствии с каждым аспектом, получается -мерное пространство:

,

где  - множество классов  (где  - индекс, идентифицирующий класс на множестве ,  - мощность множества ), которые получились в результате деления множества объектов  в соответствии с аспектом . Вектор  назовем классификационной группировкой.

В соответствии со значением функции от аргументов , которым характеризует объект, а также в соответствии с характеристиками, которые невозможно описать числовыми или качественными значениями, элемент  можно представить как точку  в -мерном пространстве . Объекту в соответствие можно поставить значение функции от -аргументов , где , …,  - индекс, идентифицирующий класс внутри одной классификационной группы.

Рассмотрим множество классов  - классификационную группировку. Такое множество является частично упорядоченным множеством, то есть на данном множестве задано отношение частичного порядка между элементами [1]. Отношение частичного порядка обладает свойствами рефлексивности, транзитивности и антисимметричности.

Рефлексивность означает, что любой элемент множества  находится в отношении с самим собой. Формальная запись свойства рефлексивности отношения £ выглядит следующим образом:
                                               , где .

Свойство транзитивности указывает на то, что если существует цепочка из (трех) элементов, связанных отношением £, то первый и последний элементы этой цепочки можно связать тем же отношением. Это свойство гарантирует построение графа отношения частичного порядка на множестве в виде «решетки». Формальная запись свойства транзитивности для отношения £ выглядит следующим образом:
                            .

Антисимметричность – свойство, которое разрешает наследование только в одном направлении и запрещает его в противоположном направлении. Формальная запись свойства антисимметричности для отношения £ выглядит следующим образом:
                            .

Для формализации модели наследования использована диаграмма Хассе. На диаграмме Хассе точками или кружками представляются элементы множества, причем если , то элемент  располагается ниже элемента , при этом элементы соединяются линией, если не существует другого элемента , такого, что  и . Приведем пример диаграммы Хассе для представления отношения включения (характерное отношения частичного порядка) на множестве всех подмножеств .

 

Рассмотрим модель наследования на простом примере классификации множества документов. Множество документов можно разбить на подмножества в соответствии с аспектом «Назначение документа». В соответствии с выбранным аспектом образуется классификационная группировка ={Организационный, Распорядительный, Нормативный}. Расширим множества классов данной группировки. Организационные документы делятся на уставы, положения, руководства, инструкции. В свою очередь инструкции делятся на должностные инструкции, инструкции по эксплуатации систем оборудования, производственные инструкции. Ниже представлена диаграмма Хассе для классификационной группировки .

В результате получена математическая модель схемы классификации объектов, основными элементами которой являются множество объектов ; множество признаков, которыми характеризуется объект - ; множество аспектов  в соответствии с которыми образуются частично упорядоченные множества классов  - классификационные группировки. На множестве  с помощью отношения частичного порядка описывается наследственная связь между элементами множества.

Полученная модель применена для реализации комплекса классификации документов для системы электронного документооборота в соответствии с алгоритмом последовательности действий построения схемы классификации.

ЛИТЕРАТУРА

1. Фролов А.Б., Андреев А.Е., Болотов А.А., Коляда К.В. Прикладные задачи дискретной математики и сложность алгоритмов. М.: МЭИ, 1997. – 312 с.