BC/NW 2008, №2 (13): 9.1

 

 

АЛГОРИТМ ПОСТРОЕНИЯ ПАРАМЕТРИЧЕСКОЙ МОДЕЛИ ИЗМЕНЧИВОСТИ СУТОЧНОГО ТРАФИКА

 

Репин Д.С. 

 

(Москва, Государственный научно-исследовательский институт информационных технологий и телекоммуникаций (ФГУ ГНИИ ИТТ "Информика"), Россия)

 

 

Рассматривается задача статистического анализа суточной изменчивости интенсивности трафика в корпоративной компьютерной сети. В качестве характеристики интенсивности  используется значение, получаемое путем усреднения за одну минуту общего количества  байт информации, проходящей через точку контроля, и выраженное в битах в секунду.  С математической точки зрения  соответствующая наблюдаемая последовательность значений интенсивности представляет собой дискретный случайный процесс (временнóй ряд). Существенно, что этот ряд относится к категории нестационарных. В этой связи представляется желательным предложить алгоритм   детального анализа свойств подобного нестационарного трафика и построения его параметрической модели, что может быть, затем  использовано, например, для целей имитационного моделирования сети [1].

 

Анализ структуры и свойств трафика, будем проводить на примере реализации, изображенной на рис. 1.  Очевидно, что она содержит, по крайней мере две компоненты: детерминированную составляющую  типа систематического дрейфа (тренда) и стохастическую компоненту  с некоторыми вероятностными свойствами.

В первую очередь выделим детерминированную компоненту. Известны два основных способа ее выделения: параметрическая аппроксимация функции  и применение сглаживающего фильтра типа скользящего среднего. При использовании параметрического подхода предполагается, что вид функции , описывающей трендовую составляющую анализируемого нестационарного процесса , известен с точностью до параметров q0, q1, …, qp, т.е. что = d(t; q0, q1, …, qp) + . Тогда задача сводится к задаче оценивания неизвестных параметров q0, q1, …, qp по N наблюдениям временного ряда ,  t — дискретное время, соответствующее номеру отсчета. Данная задача по сути является задачей получения регрессионной зависимости,  детально рассмотренной в научной литературе по математической статитстике [2].

Рис. 1.

         Попытаемся построить параметрическую модель тренда в виде полинома четвертой степени. Конечный результат в графической форме представлен на рис. 2.

Рис. 2.

Очевидно, что данная модель тренда явно неудовлетворительна. Это, по-видимому, связано с достаточно сложной и специфической формой трендовой кривой, где, в частности, присутствует начальный участок с относительно низкой интенсивностью трафика. С практической точки зрения, когда предметом наибольшего внимания является  возможная перегрузка сети, временные интервалы, с малой интенсивностью целесообразно исключить из рассмотрения. Поэтому для дальнейшего анализа будем использовать данные для t = 570 – 1440 мин. Соответствующая параметрическая модель тренда по-прежнему в виде полинома четвертой степени для указанного интервала изображена на нижеследующем рис. 3.  Очевидно, что она достаточно точно отображает трендовую составляющую процесса .

Рис. 3.

Стохастическая компонента  представляет собой  разность (рис. 4):

 =  

Рис. 4.

         Гистограмма  распределения  вероятностей и оценка нормированной корреляционной функции  для указанного временного интервала представлены соответственно на рис. 5а) и 5б).

 


 

а)

б)

Рис. 5.

Анализ приведенных рисунков показывает, что,  во-первых, можно с приемлемой точностью считать распределение стохастической компоненты достаточно близким к нормальному, а во-вторых, имеет место явная корреляционная зависимость между ординатами этой компоненты.  Это делает перспективным получение адекватной параметрической модели процесса  [2].  Действительно, удается получить адекватную модель авторегрессии 3-го порядка АР(3) вида , где ; ; .  Остаточный процесс , образующийся путем исключения из процесса   авторегрессионной компоненты, должен иметь корреляционную функцию типа - функции, т.е. относиться к категории дискретного «белого» шума.

Полученные с помощью конкретного примера результаты позволяют предложить общую схему (алгоритм) анализа нестационарного трафика. Она включает в себя следующие элементы:

Ø     экспериментальное получение временнóго ряда изменения интенсивности суточного трафика ;

Ø     выделение интервала анализа, в пределах которого интенсивность   достаточно высока;

Ø     построение параметрической модели трендовой составляющей  -например, путем ее аппроксимации полиномом четвертого порядка;

Ø     выделение стохастической компоненты ;

Ø     оценивание и анализ одномерной функции распределения вероятностей и автокорреляционной функции  процесса ;

Ø     построение параметрической модели процесса  - например, в виде модели авторегрессии порядка p;

Ø     анализ свойств остаточного процесса , образующегося путем исключения из процесса   авторегрессионной компоненты.

 

В конечном итоге найденные в соответствии с предложенным алгоритмом  параметрические модели компонент нестационарного трафика могут оказаться полезными при анализе и прогнозировании  пропускной способности и эффективности использования элементов корпоративной компьютерной сети.

ЛИТЕРАТУРА

1.       Бахвалов Л.А., Репин Д.С. Имитационное моделирование трафика в корпоративных компьютерных сетях. ХХХV Юбилейная  международная конференция «Информационные технологии в науке, образовании, телекоммуникации и  бизнесе IT + S&E’08». Украина, Крым, Ялта-Гурзуф, 20-30 мая 2008 г., стр. 138 – 140.

2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы     экономики. Учебник для вузов. – М.: ЮНИТИ, 1998. 1022 с.