BC/NW 2022 № 1 (39):6.3
АЛГОРИТМЫ ОБНАРУЖЕНИЯ АНОМАЛИЙ ДАННЫХ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
Успенская Е.О., Оцоков Ш.А.
Интеллектуальный анализ данных используется для извлечения новой и актуальной информации из больших объемов данных. Поскольку эти объемы продолжают расти, а результаты их анализа становятся все более важными, проблема выявления аномалий в них становится особенно актуальной. Результаты анализа без предварительного извлечения аномалий данных могут быть значительно искажены. Обнаружение аномалий относится к проблеме поиска закономерностей в данных, которые не соответствуют ожидаемому поведению [1].
Областью применения данной задачи является обнаружение подозрительных банковских операций, обнаружение неполадок в механизмах по показаниям датчиков, медицинская диагностика и другие. В настоящее время существует множество алгоритмов для поиска аномалий в различных типах данных, основанных на статистических и модельных тестах [2], однако использование методов машинного обучения в данной задаче имеет ряд потенциальных преимуществ [3].
Целью данной работы является исследование наиболее перспективных методов распознавания аномалий данных на основе машинного обучения, особенностей их реализации, а также их преимуществ и недостатков в сравнении с другими методами обнаружения аномалий.
В представленной статье описаны методы обнаружения аномалий путем кластеризации, классификации и при помощи нейронных сетей, а также особенности их реализации. Также был проведен обзор уже существующих методов и их сравнение. Проведенное исследование позволило определить ряд преимуществ и недостатков для каждого из рассмотренных методов на основе машинного обучения.
Литература
1. Chandola V. Anomaly detection: A survey / V. Chandola, A. Banerjee, V. Kumar // ACM Computing Surveys (CSUR). – 2009. – V. 41(3). – 72p.
2. Зубков Е. В. Методы интеллектуального анализа данных и обнаружение вторжений / Зубков Е. В., В. М. Белов // Вестник СибГУТИ № 1, 2016.
3. Hayes M. Contextual anomaly detection framework for big sensor data/ M. Hayes, M.Capretz // Journal of Big Data, vol. 2(2), 2015