BC/NW 2023 № 1 (40):2.1
КОНЦЕПЦИЯ АДАПТИВНОГО УПРАВЛЕНИЯ ТЕЛЕКОМ СЕТЬЮ С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ
Широков В. Л.
Введение
В связи с развитием общества изменяется структура трафика, растёт объём передаваемых данных, усложняется топология сетей, растут производительность и возможности сетей, в частности:
· Число подключённых в мире устройств Интернета вещей (Internet of Things – IoT) ещё в 2021 году уже достигло 12,2 млрд штук и превысило число пользователей Интернет в два раза [4].
· По прогнозу, в связи с ростом числа пользователей и подключённых устройств IoT, удалённой работой, объём ежегодного трафика с 2019 по 2024 год как минимум утроится [5].
· Наибольшую долю трафика занимает и продолжит занимать видео и с 76% в 2019 году вырастет до 80% к 2024 [OMDIA, 2020].
· В телекоммуникациях приоритет отдаётся облакам на основе технологий SDN/VNF, что еще больше увеличит сложность сетей.
Кроме этого, трафик является случайным процессом, крайне сложен, непредсказуем, имеет длинные хвосты, проявляет фрактальные свойства, а параметры трафика изменяются, как во времени, так и в пространстве.
Перечисленные сложности сетей и непредсказуемость трафика требуют гибкой и адекватной системы его анализа, управления ресурсами и трафиком в сети. Для преодоления этих сложностей предлагается использовать в системе управления трафиком и ресурсами сети метод машинного обучения с подкреплением, как одного из направлений в искусственном интеллекте.
1. Необходимость машинного обучения сети
Развивающаяся динамика рынка в сфере коммуникаций оказывает давление на операторов, провайдеров, поставщиков телеком услуг и требует дальнейшей автоматизации сетей. Проблемой становится автоматизация, которая уже не удовлетворяет заказчиков, особенно при использовании сложных беспроводных сетей доступа и передачи данных.
Для рассматриваемых объектов предлагается использовать машинное обучение (Machine Learning – ML) с подкреплением (with reinforcement) на базе нейронной сети (Neuro Net) с целью адаптивного управления телеком сетью, автоматического управления ресурсами и трафиком сети, как наиболее подходящего метода управления данными объектами.
В задачу реализации машинного обучения ML с подкреплением входят следующие этапы:
· сбор данных (Data Mining);
· анализ и классификация данных;
· выявление закономерностей трафика;
· если необходимо, закрепление в модели.
Фактически ML с подкреплением – это модели, алгоритмы и метод поэтапного решения задачи управления телеком сетью. Сначала рассмотрим предпосылки использования ML в сфере телекоммуникаций.
2. Постановка задачи
Итак, необходимо преодолеть имеющиеся сложности и разработать концепцию, а фактически – адекватную сети методологию, т.е. выбрать методы, обеспечивающие:
· сбор информации о циркулирующем в сети трафике;
· анализ полученной информации о трафике, классификацию и выявление его закономерностей как на текущий момент, т.е. в реальном времени, так и для таких периодов времени, когда параметры трафика не изменяются;
· управление сетевым трафиком и выделением ресурсов.
Для решения поставленной задачи следует учитывать следующие исходные условия:
· законы генерации трафика не известны, т.е. произвольные (General, G), параметры трафика могут изменяться во времени, пространстве и через некоторые временные периоды;
· трафик подразделяется в основном на два типа:
· реального времени, например, UDP, и
· асинхронный (фоновый), например, TCP;
· внутри каждого типа трафик может быть приоритезирован;
· законы обслуживания трафика также общие (General, G);
· трафик может обладать фрактальными свойствами, иметь длинные хвосты, параметры фракталов могут изменяться в разные периоды времени;
· используемые метрики: средняя скорость передачи и максимально допустимая временнáя задержка в пределах вычисляемого и задаваемого системой управления временного периода;
· структура и топология сети может быть произвольной, ячеистой (Mesh) и объёмной (3D), обеспечивать множество маршрутов передачи данных (трафика) в сети;
· активные узлы (сетевые коммутаторы, маршрутизаторы) могут рассматриваться как кластеры, т.е. могут иметь несколько процессорных ядер, а также – многоканальными;
· сетевые ресурсы – квантованные, т.е. должны делиться на фиксированные временные кванты (тайм-слоты), выделяемые трафику в зависимости от его параметров.
Эти условия необходимо учитывать при моделировании, анализе параметров сети, трафика, сборе информации о трафике, при управлении процессами, при выделении трафику сетевых ресурсов (временных квантов, линий связи, каналов).
Далее рассмотрим, что традиционная автоматизация обеспечивает или не в состоянии обеспечить операторам сетей.
3. Ограничения традиционной автоматизации
Телеком индустрия продолжает создавать облака с фиксированной приоритезацией, используя технологии SDN/NFV, дополнительно внося усложнения в коммуникационные сети.
Сетевая сложность ещё больше ограничивает возможности традиционной автоматизации, отрицательно влияя на операторов, а именно:
· возникают трудности удовлетворения требований соглашения о качестве обслуживания (Service Level Agreement, SLA) и восприятия качества (Quality of Experience, QoE), т.е. оценки качества обслуживания, исходя из опыта пользователей, аналогично MOS (Mean Opinion Score), используемой в телефонии для усреднённой экспертной оценки разборчивости речи;
· ограничивается обзорность сети;
· рабочие режимы становятся неэффективными;
· снижается оценка клиентов качества обслуживания (QoE);
· замедляется перевод услуг в режим коммерческой эксплуатации;
· сети становятся больше подвержены атакам на их безопасность;
· эксплуатационные расходы (OPEX) оператора сети составляют более 60% всех доходов.
К тому же традиционный подход к автоматизации основан на фиксированных политиках и правилах. Однако возможности этого подхода ограничены экспертизой и знаниями соответствующего персонала. Следовательно, данный подход и традиционная автоматизация недостаточны и ограничены.
4. Выгоды AI/ML автоматизации
Использование автоматизации с использованием AI/ML обеспечивает упрощение для оператора управление сетью и в её эксплуатационной эффективности. И даёт следующие преимущества:
· снижаются эксплуатационные расходы (OPEX);
· улучшается операционная эффективность и управляемость;
· ускоряет перевод услуг в коммерческую эксплуатацию;
· повышается усреднённая оценка пользователей о качестве обслуживания, т.е улучшается восприятие качества (QoE).
Поэтому ключевое решение – это переход к автоматизации сетей, основанное на применении методов, базирующихся на машинном обучении, т.е. ML в AI.
Эти методы управляются данными, поэтому рассматриваемое решение можно масштабировать, поддерживая несколько операторов и сценариев одновременно.
В машинном обучении ML могут использоваться несколько методов:
· NLP (Natural Language Processing) – алгоритмы распознавания текста и речи;
· DL (Deep Learning) – метод распознавания изображений нейронной сетью;
· ANN (Artificial Neural Networks) – искусственные нейронные сети (ИНС)
и т.д.
Очевидно, что для автоматизации управления сетью необходимо использовать в машинном обучении ML модель искусственной нейронной сети (ANN, ИНС).
Препятствием для реализацуии AI/ML может быть сложность и недоступность исходных данных, поскольку:
· исходные данные имеют решающее значение для внедрения AI/ML, т.к. серьезной проблемой являются качество и актуальность данных;
· факторы качества и актуальности данных влияют на то, насколько быстро система AI/ML проанализирует обучающие наборы, необходимые для генерации требуемой модели управления ANN;
· решение на основе AI/ML/ANN должно преодолеть барьеры в исходных данных, чтобы ускорить внедрение автоматизации.
Для большего понимания ограничений, которые могут возникнуть при внедрении AI/ML в телеком сети, рассмотрим результаты опроса операторов, выполненные компанией Omdia [Adaora Okeleke, 2020]. Было показано, какие могут быть сдерживающие факторы и процент их влияния на использование AI/ML в телеком сетях. Эти барьеры по убыванию их влияния перечислены далее в таблице 1.
Табл.1
№ п/п |
Содержание сдерживающего фактора |
% влияния |
1. |
«Грязные» или недостаточные исходные данные |
49 |
2. |
Отсутствие управленческой или финансовой поддержки |
48 |
3. |
Отсутствие талантливых исполнителей в науке о данных (Data Science) |
48 |
4. |
Отсутствие чётких вопросов, на которые нужны ответы |
34 |
5. |
Нужные данные недоступны или труднодоступны |
33 |
6. |
Результаты не используются лицами принимающими решение |
32 |
7. |
Необходимость соблюдения конфиденциальности |
27 |
8. |
Сложность интеграции с имеющимся решением |
22 |
9. |
Трудности объяснения Data Science другим лицам |
21 |
10. |
Необходимость согласования решения с IT-отделом |
21 |
11. |
Отсутствие в организации эксперта в Data Science |
20 |
12. |
Длительность ожидания результата внедрения |
17 |
13. |
Использование специальных сред при передаче данных |
17 |
14. |
Ограниченность в инструментальных средствах |
17 |
15. |
Невозможность нанять команду по Data Science |
16 |
Анализируя табл.1, можно прийти к выводу, что в телеком сети есть необходимые исходные данные для создания автоматизированной системы, использующей AI/ML, пп.1 и 5 разрешимы.
В трафике всегда содержатся адреса источника и приёмника, тип и объём передаваемых данных известен. Данные могут быть привязаны ко времени. А смысловое содержание передаваемых данных для целей управления не требуется. И этих данных о трафике достаточно, чтобы рассчитывать
Другими барьерами при создании системы AI/ML являются еще три пункта: 2, 3 и 4. Однако и они могут быть легко преодолены.
Остальные барьеры можно считать несущественными, поскольку они могут быть тоже разрешены.
Таким образом, в коммуникационных сетях необходимо и достаточно акцентировать внимание на поведении данных, а не на их содержании. И поскольку перечисленные выше факторы преодолимы, задача машинного обучения системы AI/ML для телеком сети может быть решена.
Однако необходимо учитывать, что эффективность работы системы также будет зависеть от длительности периода машинного обучения. Его продолжительность должна составлять как минимум не менее нескольких периодов повторяемости фрактальных свойств трафика в сети.
5. Функционирование системы ML
Рассмотрим, каким образом функционирует система машинного обучения ML с подкреплением.
На рис.1 показана блок-схема системы ML, когда она извлекает, обрабатывает и собирает необходимые для обучения данные, обеспечивая ими модель искусственной нейронной сети.
Система ML работает в трёх режимах:
· обучения;
· тестирования (для подкрепления);
· в рабочем режиме.
Причём эта система может извлекать, использовать и работать с данными из нескольких источников, используя:
· пакетное ядро сети;
· сеть радиодоступа (RAN;
· IP-мультимедиа подсистема (IP Multimedia Subsystem – IMS);
· количественные и качественные показатели работы каналов (PM Stats);
· отладочные лог-файлы (информация о действиях пользователей и о работе ПО);
· сообщения (предупреждения) ядра системы.
80%
20% Выход
Вход
100%
Рис. 1. Блок-схема системы ML / ИИ
Например, из этих источников могут быть получены данные о параметрах передачи голоса по сети 4G, то есть VoLTE (Voice over Long Term Evolution). И эти данные используются для управления качеством передачи голосовой информации.
Кроме того, система ML с закреплением может работать с несколькими источниками данных, при этом следующим образом:
· осуществлять выборку и агрегировать данные;
· выполнять контекстно-чувствительную фильтрацию;
· инициировать захват и XDR трассировку многоуровневого представления (eXternal Data Representation, т.е. обнаружения угроз и реагирования на инциденты).
Таким образом, машинное обучение ML может обеспечить решение нескольких основных задач, связанных с управлением ресурсами и трафиком, а именно:
· классификация трафика;
· маршрутизация трафика;
· управление ресурсами;
· управление QoS/QoE;
· управление неисправностями;
· управление перегрузками;
· прогноз трафика.
Дополнительно система AI/ML может также решать задачи контроля сетевой безопасности в телекоммуникационной сети.
Обработка данных от нескольких источников может привести к перегрузкам системы AI/ML. Поэтому необходимо учитывать также требуемые от системы вычислительные и канальные ресурсы.
Кроме этого, система машинного обучения ML с подкреплением подходит и для комплексной автоматизации телеком сетей, и лучшие результаты этого применения могут быть получены именно при комплексном решении. Однако это отдельная тема и она требует отдельного рассмотрения.
В заключение можно привести следующие выводы.
Заключение
1. Растёт сложность трафика и оборудования коммуникационных сетей. Поэтому современные системы контроля сетей требуют постоянного мониторинга и своевременного управления трафиком и сетевыми ресурсами сети и комплексногой автоматизации.
2. Решение проблем состоит в использовании в автоматизированной системе управления машинного обучения и искусственной нейронной сети.
3. Дальнейшая автоматизация телеком сетей, использующих машинное обучение и искусственный интеллект, может обеспечить автоматическую динамическую адаптацию системы управления к рабочим режимам, улучшит качество услуг, облегчит эксплуатацию и повысит эффективность сети.
Список литературы
[5] @TAdviser 2021. Сколько данных в мире было создано в 2020 году. URL: https://news.myseldon.com/ru/news/index/248245472 (Дата обращения: 01.04.2021)