BC/NW 2008, №2 (13): 4.2

ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ РЕСУРСОВ ЦЕНТРОВ ОБРАБОТКИ ДАННЫХ В СЕТЯХ ЭЛЕКТРОННОГО БИЗНЕСА

Ворожцов А.С., Тутова Н.В.

Московский технический университет связи и информатики, РФ

Для ведения электронного бизнеса компания может использовать как внутренние ИТ-ресурсы, так и прибегнуть к покупке ИТ-услуг у специализированного сервис-провайдера, имеющего собственные центры обработки данных. Наиболее распространенной формой организации электронного бизнеса компаний является аутсорсинг ИТ-услуг у сервис-провайдера. Современная сеть сервис-провайдера представляет собой совокупность взаимосвязанных центров обработки данных, которые могут включать в себя до нескольких сотен серверов, в том числе Web-серверов, серверов приложений и серверов баз данных и обслуживать миллионы пользователей. Многие сервис-провайдеры предлагают широкий спектр услуг, в том числе хостинг и администрирование приложений электронного бизнеса. В случае выделенного хостинга (dedicated hosting) под каждое приложение отведена совокупность серверов, которые обслуживают только это приложение. Такой тип хостинга используется для работы крупных приложений, где кластер серверов обслуживает одно приложение. В случае совместного (shared) хостинга, кластер серверов обслуживает большое количество приложений и число приложений, как правило, превышает число серверов в кластере.

Качество предоставляемых сервис-провайдером услуг во многом определяет конкурентоспособность и прибыльность компании, занимающейся электронной коммерцией. Известен тот факт, что если Web-страница загружается более 8-10 секунд, то многие пользователи теряют терпение и переходят на другой сайт. В результате компании, занимающиеся электронной коммерцией, теряют клиентов [1]. Поэтому современный процесс обслуживания запросов клиентов к сайтам электронного бизнеса характеризуется появлением соглашений о качестве обслуживания (SLA), в которых оговаривается совокупность показателей качества и их пороговые значения. Наиболее распространенными показателями качества, оговариваемых в SLA-соглашениях являются среднее время ответа на запрос пользователя, вероятность превышения времени ответа на запрос от заданной величины, а также другие показатели, например, коэффициент готовности, максимальное время одного простоя и др. Например, в SLA может быть указано, что среднее время ответа не должно превышать одной секунды не зависимо от нагрузки, а в случае превышения среднего времени ответа провайдер должен выплатить компании штраф. Поэтому невыполнение SLA-соглашений сервис-провайдером может привести к значительным штрафам и переходу клиентов к конкурентам. Актуальность проблемы также обусловлена следующими причинами:

  • Сложной трехзвенной архитектурой приложений электронного бизнеса с различными компонентами программного обеспечения;
  • Динамическим контентом—доля динамически формируемого Web-приложениями контента, по сравнению со статическим контентом, постоянно растет;
  • Вариациями нагрузки в течение дня, а также кратковременными всплесками нагрузки;
  • Различными классами запросов, определенных в SLA-соглашениях.

 

Среднее время ответа на запрос и вероятность превышения времени ответа от заданной величины являются одними из наиболее важных показателей, характеризующих качество работы сервис-провайдера. Сервис-провайдер может повлиять на эти показатели как на уровне центра обработки данных (узла), так и сети в целом. На уровне узла, это реализуется путем включения дополнительных серверов в кластеры. Однако число серверов должно определяться в зависимости от входящей нагрузки, иначе оборудование сервис-провайдера будет недостаточно загружено и, как следствие, провайдер будет нести дополнительные затраты. Поэтому нахождение оптимального числа серверов в центре обработки данных является актуальной задачей.

Для решения этой задачи были поставлены задачи оптимизации ресурсов центров обработки данных с двумя критериями (затраты и пропускная способность) и ограничениями на среднее время ответа и вероятность превышения времени ответа от заданной величины и предложена технология их решения [2]. Задачи оптимизации основываются на разработанной модели центра обработки данных, имеющего трехзвенную архитектуру (Web-серверы, серверы приложений и серверы баз данных), являющейся наиболее распространенной в приложениях электронного бизнеса.

Оптимизацию центра обработки данных предлагается проводить в несколько этапов. На первом этапе проводится анализ системы SLA-соглашений и нахождение оптимального среднего времени ответа с учетом общих затрат и доходов от соглашений. Полученное среднее время ответа используется на втором этапе оптимизации, где определяется оптимальное число серверов. В случае если в SLA включен показатель вероятности

Рис. 1.

превышения времени ответа, то применяется третий этап оптимизации, на котором определяется оптимальное число серверов с учетом пользовательских сессий и ограничения на вероятность превышения времени ответа от заданной величины.

Для решения поставленных двухкритериальных задач была предложена и теоретически обоснована процедура нахождения оптимального по Парето решения, основанная на комбинации метода последовательных уступок и метода ограничений, алгоритм которой приведен на рис. 1. На основе задаваемого лицом принимающем решения вектора предпочтений одноэтапно определяется величина уступки, что позволяет значительно снизить количество обращений к ЛПР и тем самым более чем в два раза быстрее получить компромиссное решение по сравнению с методом последовательных уступок.

При решении многокритериальной задачи методом последовательных уступок с увеличением числа критериев возрастает число обращений к ЛПР и общее время решения задачи, тогда как при решении задачи методом последовательных уступок с модифицированной процедурой нахождения компромиссной уступки число обращений к ЛПР остается неизменным, а время решения задачи возрастает не так стремительно, что отражено на рис. 2, 3.

Таким образом, предложенная процедура нахождения решения, основанная на комбинации методов последовательных уступок и ограничений, позволяет реализовать разработанную технологию решения задач оптимизации ресурсов центров обработки данных за приемлемое время.

Рис. 2.

Рис. 3.

Внедрение кластерной технологии позволяет сервис-провайдеру масштабировать систему и повышать ее готовность. Однако не всегда является возможным спрогнозировать нагрузку и заранее подготовить достаточное количество вычислительных ресурсов, поскольку нагрузка может иметь большие кратковременные всплески. Одним из подходов для предотвращения возможных перегрузок Web-сайта является контроль доступа. Простой механизм контроля доступа отбрасывает запросы пользователей к сайту, если число запросов превышает определенную величину, однако такой подход не пригоден для сайтов электронной коммерции. В этом случае должны использоваться более сложные механизмы контроля доступа, учитывающие пользовательские сессии и приоритеты запросов. Под пользовательскими сессиями понимают последовательности логичных и связанных запросов. В электронной коммерции имеет значение, не только показатель пропускной способности, характеризующий число обслуженных запросов в единицу времени, но и число завершенных сессий, которые закончились покупкой товара.

Контроль доступа на основе http-заголовков рассмотрен в [3]. Внутренние механизмы по предотвращению перегрузок сервера на основе контроля доступа и дифференциации услуг были представлены в [4]. Контроль доступа, основанный на сессиях, предложен в работе [5].

Несколько другой подход к решению этой проблемы, ориентированный не на такие традиционные показатели, как время ответа, пропускная способность и готовность, а на доход и прибыль сайта электронной коммерции, был предложен в [6]. В данной работе рассматриваются вопросы динамического управления ресурсами сайта электронной коммерции с целью увеличения финансовой пропускной способности за счет выставления приоритетов посетителям сайта. Под финансовой пропускной способностью сайта понимается денежная сумма, которая была накоплена в электронных корзинах покупателей и трансформирована в доход торговой компании. В случае перегрузки сайта и медленной загрузки страниц некоторые потенциальные покупатели могут уйти с сайта. Поэтому задача заключалась в минимизации потерь потенциальных клиентов за счет выставления приоритетов пользователям и выделения в соответствии с их приоритетом технических ресурсов. Предложенная схема выставления приоритетов основывалась на длине сессии пользователя, которая измерялась количеством запросов, и сумме, накопленной в его электронной корзине. Так, например, наивысший приоритет имел пользователь, только пришедший на сайт, тогда как пассивные пользователи, пробывшие на сайте продолжительное время и ничего не положившие в корзину, имели самый низкий приоритет. Эффективность такого подхода была подтверждена имитационным моделированием, результаты которого показали, что с применением предложенной схемы выставления приоритетов финансовая пропускная способность может быть увеличена от 5 до 30%.

В работе предлагается альтернативный подход к определению длительности сессии, в соответствии с которой будут приниматься решения о присвоении приоритетов.

Для решения этой задачи была проанализирована статистика сайтов электронной коммерции за различные промежутки времени, для чего было разработано программное обеспечение.

Результаты показали, что поступление сессий за заданный период имеет пуассоновское распределение, а число запросов в сессии подчиняется логарифмически-нормальному закону. С использованием аппарата теории вероятностей и математической статистики было найдено соотношение между характеристической функцией числа запросов и характеристической функцией длительности сессии. На основе этого соотношения было найдено приближенное аналитическое выражение для плотности распределения вероятности длительности сессий, которое может использоваться для обоснования выставления приоритетов пользователям в периоды пиковых нагрузок.

 

Выводы:

1.     Процедура одноэтапного определения компромиссного решения, основанная на комбинации методов последовательных уступок и ограничений позволит значительно сократить время решения задачи, что позволит сервис-провайдеру включить оптимизацию в контур управления ресурсами центров обработки данных.

2.     Предложенная методика определения длительности пользовательских сессий позволит определить их величину, начиная с которой следует ограничивать доступ к сайтам пассивных пользователей, что повысит финансовую пропускную способность центра обработки данных.

ЛИТЕРАТУРА

1.     Zona Research, Inc. The Need for Speed II. — Zona Market Bulletin (5), April 2001 http://www.keynote.com/downloads/Zona_Need_For_Speed.pdf

2.     Тутова Н.В., Ворожцов А.С. Модели оптимизации технологий обработки данных в сетях электронного бизнеса // Труды МТУСИ.— М.: ИД Медиа Паблишер, 2007. — С. 249-255.

3.     Voigt, T., Tewari, R., Freimuth, D., Mehra, A. Kernel Mechanisms for Service Differentiation in Overloaded Web Servers. — In Proceedings of USENIX Annual Technical Conference, June 2001.

4.     Elnikety S., Nahum E., Tracey J., Zwaenepoel W. A Method for Transparent Admission Control and Request Scheduling in E-Commerce Web Sites. — 13th International Conference on World Wide Web (WWW’04) , New York, USA, 2004. — С. 276-286,

5.     Cherkasova, L., Phaal P. Session based admission control: a mechanism for improving performance of commercial web sites. — HP laboratories Technical Report, HPL-98-119, 1998.

6.     Menascé D.A., Almeida V.A.F., Fonseca R., Mendes M.A. Business-oriented resource management policies for e-commerce servers — Performance Evaluation 42, 2000. — С. 223–239