Исследование способов
НЕЧЕТКОГО кластерного анализа данных
М.В.
Пряжевский, асп.; рук. В.В. Топорков, д.т.н., проф.
(МЭИ (ТУ), каф. ВТ)
Наибольший интерес в рамках задачи нечеткого кластерного анализа
представляют нечеткие отношения (НО) сходства и эквивалентности. НО
эквивалентности определяет разбиение множества исследуемых объектов на
непересекающиеся классы эквивалентности, то есть задает иерархическую
совокупность разбиений множества, представленных в виде декомпозиционного
дерева. Также можно использовать и менее строгое понятие, довольно интересное
при различных операциях – понятие максимальных подотношений, которые могут быть
как пересекающимися, так и не пересекающимися. При проведении нечеткого
кластерного анализа необходимо решить две связанные между собой задачи:
1. задать на
множестве исследуемых объектов нечеткое отношение эквивалентности,
2. провести
разложение нечеткого отношения эквивалентности, решив тем самым задачу
кластеризации.
В практических задачах матрица сходства исследуемых объектов, для которых условия симметричности и рефлексивности имеют естественную интерпретацию, может быть получена как в результате измерения некоторого физического параметра, отражающего связи между объектами, так и в результате опроса экспертов. Тогда решение первой задачи сводится к транзитивному замыканию НО сходства, в результате которого будет получено НО эквивалентности.
Решением второй
задачи является разложение НО эквивалентности, которое можно производить
несколькими способами. Первый способ заключается в разложение НО
эквивалентности на a-уровни, то есть на набор
вложенных друг в друга четких (неразмытых) отношений эквивалентности.
Интерпретация величины a может быть спорной, но в то
же время исследователь получает наиболее полное представление о связях между
объектами. Второй способ основан на разложении НО эквивалентности на
определенном a-уровне на взвешенную сумму
обычных отношений, в общем случае не вложенных друг в друга. Такое разложение
будет давать нам уже не классы эквивалентности, а максимальные, в общем случае
непересекающихся, подотношения, интерпретация которых бесспорна, особенно когда
речь идет о приложениях в области классификации структур.