BC/NW 2022 № 1 (39):6.3

АЛГОРИТМЫ ОБНАРУЖЕНИЯ АНОМАЛИЙ ДАННЫХ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Успенская Е.О., Оцоков Ш.А.

Интеллектуальный анализ данных используется для извлечения новой и актуальной информации из больших объемов данных. Поскольку эти объемы продолжают расти, а результаты их анализа становятся все более важными, проблема выявления аномалий в них становится особенно актуальной. Результаты анализа без предварительного извлечения аномалий данных могут быть значительно искажены. Обнаружение аномалий относится к проблеме поиска закономерностей в данных, которые не соответствуют ожидаемому поведению [1].

Областью применения данной задачи является обнаружение подозрительных банковских операций, обнаружение неполадок в механизмах по показаниям датчиков, медицинская диагностика и другие. В настоящее время существует множество алгоритмов для поиска аномалий в различных типах данных, основанных на статистических и модельных тестах [2], однако использование методов машинного обучения в данной задаче имеет ряд потенциальных преимуществ [3].

Целью данной работы является исследование наиболее перспективных методов распознавания аномалий данных на основе машинного обучения, особенностей их реализации, а также их преимуществ и недостатков в сравнении с другими методами обнаружения аномалий.

В представленной статье описаны методы обнаружения аномалий путем кластеризации, классификации и при помощи нейронных сетей, а также особенности их реализации. Также был проведен обзор уже существующих методов и их сравнение. Проведенное исследование позволило определить ряд преимуществ и недостатков для каждого из рассмотренных методов на основе машинного обучения.

 

Литература

1.    Chandola V. Anomaly detection: A survey / V. Chandola, A. Banerjee, V. Kumar // ACM Computing Surveys (CSUR). – 2009. – V. 41(3). – 72p.

2.    Зубков Е. В.  Методы интеллектуального анализа данных и обнаружение вторжений / Зубков Е. В., В. М. Белов // Вестник СибГУТИ № 1, 2016.

3.    Hayes M.  Contextual anomaly detection framework for big sensor data/ M. Hayes, M.Capretz // Journal of Big Data, vol. 2(2), 2015