BC/NW 2006, №2, (9) :4.5

 

НЕЧЁТКОЕ ОТНОШЕНИЕ НЕРАЗЛИЧИМОСТИ ДЛЯ ОБРАБОТКИ ТАБЛИЦ РЕШЕНИЙ НА ОСНОВЕ ТЕОРИИ ПРИБЛИЖЁННЫХ МНОЖЕСТВ[1]

 

О.В. Виноградов

 

(Москва, Московский энергетический институт (Технический университет), Россия)

 

Язык таблиц решений (ТР) получил широкое распространение при автоматизации процессов принятия решений, проектирования, диагностики и контроля, в имитационном моделировании ([1]). Использование табличных баз знаний (БЗ) в системах поддержки принятия решений (СППР) не сводится только к принятию решения по заданному входному вектору. Ещё на этапе разработки СППР могут ставиться различные задачи обработки ТР, в том числе проверка определённых свойств таблиц решений и их оптимизация по некоторым критериям. Такого рода обработка ТР требуется как при первичной разработке СППР, так и при её последующей динамической модификации. В связи с этим возникает необходимость построения комплекса алгоритмов, позволяющих реализовывать обработку таблиц решений за минимальное время. Желательным также является наличие единой теоретической базы у этих алгоритмов, что позволяет использовать в них общие структуры данных, сокращая тем самым общее время вычислений. На данный момент известны несколько алгоритмов проверки полноты/непротиворечивости ТР, однако они разрозненны, часть из них имеет достаточно высокую вычислительную сложность. Методы оптимизации ТР исследованы в меньшей степени. Для решения задач обработки ТР предлагается использовать аппарат приближённых множеств ([3]). Для этого требуется построить расширение базовой теории приближённых множеств с целью адаптации её понятий к семантике таблиц решений.

 

Введём основные используемые понятия. ТР зададим набором  ([1]). Четверка  есть традиционное определение ТР, где  – множество условий или идентификаторов условий, рассматриваемых как координаты векторов описания ситуаций или состояний (векторов данных),  – множество действий или идентификаторов действий, рассматриваемых как координаты векторов действий;  и , где  или , – матрицы соответствия между векторами данных (состояниями) и действиями. Компонент  может содержать дополнительную информацию (например, о коэффициентах применимости продукций, сложности вычисления условий, отношениях между ними и т. п.). В матрице  допускается использование символов безразличия «*», указывающих на то, что определённое условие несущественно для определения применимости данного правила. Если правило содержит символы «*», то оно называется обобщённым, в противном случае правило называется простым. При практическом применении ТР необходимо уметь гарантировать наличие у ТР некоторых свойств, придающих процессу принятия решений на их основе надёжность и эффективность. К таким свойствам относятся полнота, непротиворечивость и неизбыточность. Последнее свойство может быть обобщено до понятия оптимальности ТР по некоторому критерию, в качестве таких критериев можно также рассматривать минимальное число правил в ТР, максимальное число символов «*» в матрице  и др.

Предметом рассмотрения в теории приближенных множеств являются универсум  (конечное множество однотипных объектов предметной области) и заданное на нем бинарное отношение , называемое отношением неразличимости (indiscernibility relation). На практике рассматривают универсум в виде таблицы с данными, где каждый объект представляется строкой значений. Вводится формальное понятие решающей системы (decision system) вида , где  – универсум, а  и  – множества атрибутов-условий и атрибутов-решений, описывающих свойства объектов универсума. Для произвольного подмножества атрибутов  отношением неразличимости  называется отношение . Отношение неразличимости является центральным в теории приближенных множеств, на основе него вводятся все остальные понятия теории, в том числе аппроксимации множеств, матрицы и функции различимости, редукции и др. Отношение неразличимости, введённое выше, принадлежит к классу отношений эквивалентности. На практике встречаются случаи, когда удобнее рассматривать отношения неразличимости более общего вида, для которых, например, не выполняются свойства транзитивности и/или симметричности.

Была поставлена задача поиска методов обработки ТР на основе теории приближённых множеств, в том числе для проверки свойств и оптимизации таблиц решений. Формальный изоморфизм структуры ТР (при отсутствии компонента ) и решающих систем  очевиден, но традиционная интерпретация информационного содержимого этих структур различается. Если представить экспертную ТР в формализме приближенных множеств, то к ней будут применимы все методы обработки решающих систем. Таким образом, получаем практически готовые методы обработки ТР, решающие задачи проверки некоторых свойств ТР, выделения детерминированной подтаблицы из недетерминированной ТР и оптимизации ТР по числу используемых условий и продукционных правил. Интересно, что получаемый эффект достигается при кодировании информации более высокого уровня (т.е. продукционных правил из ТР) в форме, характерной для низкоуровневой информации («сырых» данных) с последующим извлечением оптимизированных правил.

Массовость наличия символов безразличия в реальных ТР является существенной особенностью решающих систем, получаемых при обработке ТР. Полное раскрытие всех символов пропуска едва ли возможно, так как ведёт к экспоненциальному росту размеров таблиц, усложняя их обработку. Поэтому целесообразнее оставлять символы пропуска без изменений, усложняя топологию отношения неразличимости. Пока в ТР отсутствуют символы «*» отношение неразличимости на множестве правил строится простым сравнением значений условий на правилах. Но присутствие символа безразличия существенно усложняет картину. Казалось бы, можно интерпретировать символ безразличия как неизвестное значение данного условия. В терминах предиката различимости discerns такое отношение может быть записано в виде . Это отношение является рефлексивным и симметричным, но не обладает свойством транзитивности.

На первый взгляд такое интуитивное построение неразличимости на основе символа * является вполне естественным. Однако можно построить пример, из которого видно, что трактовка символа * как простого отсутствия данных (безразличия) приводит к нежелательным последствиям: неразличимыми становятся правила, распознающие существенно различающиеся наборы входных векторов. В ходе исследований стала очевидной необходимость перехода к нечёткому отношению неразличимости, так как только оно может адекватно передать степень неразличимости обобщённых правил. Функция принадлежности нечёткого отношения неразличимости решающих правил ТР с расширенным входом при сравнении по одному условию  приведена в таблице 1, где через  обозначено множество значений, которые может принимать условие . Отношение неразличимости по нескольким условиям строится пересечением отношений по единичным условиям ([Леон’03]) с применением оператора произведения вещественных чисел (*-пересечение): .

Табл. 1. Функция принадлежности

*

*

*

*

1.0

 

Разработанные на основе введённого отношения неразличимости алгоритмы проверки непротиворечивости и оптимизации ТР были реализованы в расширенной версии системы СИМПР-Windows 2.2, разрабатываемой на кафедре Прикладной математики МЭИ (ТУ). Работы по данной тематике выполнялись в научной группе д.т.н. проф.  Вагина В.Н. и д.т.н. проф. Еремеева А.П. в плане НИР кафедры Прикладной математики МЭИ (ТУ) по тематике «Разработка систем поддержки принятия решений на основе аппарата нетрадиционных логик».

ЛИТЕРАТУРА

1.      Еремеев А. П. О корректности продукционной модели принятия решений на основе таблиц решений // Автоматика и Телемеханика, №10, 2001, с. 78-90.

2.      Леоненков А. В. Нечёткое моделирование в среде MATHLAB и fuzzyTECH. – СПб.: БХВ-Петербург, 2003, ISBN 5-94157-087-2.

3.      Pawlak Z. Rough Sets // International Journal of Computer and Information Science, № 11, 1981, p. 341-356.

4.      Виноградов О.В. Разработка и реализация методов обработки баз знаний для систем поддержки принятия решений реального времени // Тезисы докладов XIV Международной студенческой школы-семинара «Новые информационные технологии» – М.: МИЭМ, 2006, ISBN 5-94506-138-7, с. 213-214.

 

 

 



[1] Работа выполнена при финансовой поддержке РФФИ (проект № 05-07-90232)