Исследование способов НЕЧЕТКОГО кластерного анализа данных

 

 

М.В. Пряжевский, асп.; рук. В.В. Топорков, д.т.н., проф.

 

 

(МЭИ (ТУ), каф. ВТ)

 

 

 

 

Наибольший интерес в рамках задачи нечеткого кластерного анализа представляют нечеткие отношения (НО) сходства и эквивалентности. НО эквивалентности определяет разбиение множества исследуемых объектов на непересекающиеся классы эквивалентности, то есть задает иерархическую совокупность разбиений множества, представленных в виде декомпозиционного дерева. Также можно использовать и менее строгое понятие, довольно интересное при различных операциях – понятие максимальных подотношений, которые могут быть как пересекающимися, так и не пересекающимися. При проведении нечеткого кластерного анализа необходимо решить две связанные между собой задачи:

1. задать на множестве исследуемых объектов нечеткое отношение эквивалентности,

2. провести разложение нечеткого отношения эквивалентности, решив тем самым задачу кластеризации.

В практических задачах матрица сходства исследуемых объектов, для которых условия симметричности и рефлексивности имеют естественную интерпретацию, может быть получена как в результате измерения некоторого физического параметра, отражающего связи между объектами, так и в результате опроса экспертов. Тогда решение первой задачи сводится к транзитивному замыканию НО сходства, в результате которого будет получено НО эквивалентности.

Решением второй задачи является разложение НО эквивалентности, которое можно производить несколькими способами. Первый способ заключается в разложение НО эквивалентности на a-уровни, то есть на набор вложенных друг в друга четких (неразмытых) отношений эквивалентности. Интерпретация величины a может быть спорной, но в то же время исследователь получает наиболее полное представление о связях между объектами. Второй способ основан на разложении НО эквивалентности на определенном a-уровне на взвешенную сумму обычных отношений, в общем случае не вложенных друг в друга. Такое разложение будет давать нам уже не классы эквивалентности, а максимальные, в общем случае непересекающихся, подотношения, интерпретация которых бесспорна, особенно когда речь идет о приложениях в области классификации структур.