Russian Language English Language

11 Модели и методы для оценки надежности ВС

11.1 Модели оценки надежности кластерной системы специального назначения

11.2 Решение задачи анализа надежности на параллельной вычислительной системе


Экспресс информация

Редколлегия журнала

Подписка на новости

Гостевая книга

Предоставление материалов

Письмо в редакцию

На начало


2003, Номер1, ( 3)



Place for sale
кластер - это группа вычислительных машин, которые связаны между собою и функционируют как один узел обработки информации

BC/NW 2003г., №1(3)/ 11.1

 

 

 

 

МОДЕЛИ ОЦЕНКИ НАДЕЖНОСТИ КЛАСТЕРНОЙ СИСТЕМЫ СПЕЦИАЛЬНОГО НАЗНАЧЕНИЯ

 

 

Климанов В.П., Сутягин М.В., Родионов А.Э., Ермаков А.А.

 

 

(Москва, Московский государственный технологический университет «Станкин», Россия)

 

 

 

 

 

Современное общество предъявляет повышенные требования к качеству продукции (услугам, программным и техническим средствам, материалам). Надежность является одной из составных частей системы обеспечения качества.

В задаче повышения надежности можно выделить два основных направления: повышение надежности компонент информационных систем (ИС)  — параметрическое  или их резервирование — структурное. Такая задача появилась давно, но в настоящее время появились необходимые и достаточные условия для ее рационального решения за счет использования сетевых технологий.

О надежности ИС судят по готовности. Существует несколько уровней готовности ИС. Различают системы:

·        обычные (Conventional);

·        высокой готовности (High Availability);

·        эластичные к отказам (Fault Resiliency);

·        устойчивые к отказам (Fault Tolerance);

·        непрерывной готовности (Continuous Availability).

В системах устойчивых к отказам и непрерывной готовности необходимо использование кластерных технологий.

Кластерэто группа вычислительных машин, которые связаны между собою и функционируют как один узел обработки информации.

Кластер функционирует как единая система — для пользователя или прикладной задачи вся совокупность вычислительной техники выглядит как единая система.

По функциональности кластеры можно разделить на кластеры высокой надежность(High Availability) и "Высокоскоростные" (High Performance), а так же смешанные системы.

По экспертным оценкам причины отказов в ИС выглядят следующим образом:

  • отказы дисков - 27%,
  • отказы сервера или его ядра - 24%,
  • отказы в программах - 22%,
  • отказы в коммуникационном оборудовании - 11%,
  • отказы в каналах передачи данных - 10%,
  • отказы из-за ошибок персонала - 6%.

Следует отметить, что отказы коммуникационном оборудовании и каналах передачи данных составляют 21%.

В качестве одного из решений повышения надежности ИС авторами  предлагается оригинальная схема (рис. 1) организации кластерной системы, обеспечивающая резервирование коммуникационного оборудования и каналов передачи данных.

Рассмотрим кластерную систему, состоящую из 2 серверов и 2 накопителей, соединенных при помощи 2-х магистралей FDDI. Кластерная система работоспособна, если соединены между собой хотя бы один сервер и накопитель.

 

Рис. 1.

Для оценки показателя готовности такой кластерной системы необходимо построить математическую модель. Для моделирования надежности были использована технология цепей Маркова, базирующаяся на уравнении Колмогорова, что позволяет производить количественный анализ функционирования системы.

Разработанная модель базируется на ниже изложенных положениях.

Исходный поток отказов имеет интенсивность λ. Это условная плотность вероятности возникновения отказа. Таким образом, интенсивность единичного отказа будет иметь величину 1/8 λ. Систему с чередование целесообразно рассматривать с 8 бригадами восстановления, каждая из которых обслуживает 1 из возможных участков разрывов. Интенсивность  восстановления — μ.

Целью построения модели является получение коэффициента готовности по интенсивностям отказов и восстановлений.

За основу построения графа состояний  (рис. 2) возьмем число связей между элементами кластерной системы. Вершина 20 на графе характеризует состояние при котором система теряет работоспособность. Коэффициент готовности равен .

 

Рис. 2.

 

На основе разработанного графа переходов из состояния в состояние была получена система дифференциальных уравнений Колмогорова, которая имеет вид:

Последнее уравнение задает условие нормировки.

Решение ищется для стационарного режима, поэтому дифференциальные уравнения преобразуются в алгебраические.

Для решения представленной системы уравнений используется численный метод Гаусса. Математическая модель реализована в среде Visual C++.

Результаты моделирования — зависимость коэффициента готовности от отношения р= l/m — представлены на рис. 3.

Например, для создания системы, устойчивой к отказам (коэффициента готовности — 0,99999) отношение  l/m должно быть равно 0,076923077.

Рис. 3

 

Таким образом, разработана программная среда анализа надежности кластерных систем, базирующихся на сетевых технологиях с использованием FDDI, позволяющая оценивать надежность кластерных систем рассматриваемого вида.

 

ЛИТЕРАТУРА

1. Сутягин М.В. «Анализ катастрофоустойчивости кластерных вычислительных систем». Международный форум информатизации — 2002: Доклады международной конференции «Информационные средства и технологии» 15–18 октября 2002 г., в 3-х т.т., Т1—М., Янус-К, 2002.—198 с., с.66–69.

2. Технологии организации высоконадежных систем. TruCluster Server V5. http://www.alphaserver.ru/solutions/trucluster.

3. Климанов В.П., Сутягин М.В., Быстрикова В.А. «Кластеризация вычислительных систем и вопросы их катастрофоустойчивости», электронный журнал «Автоматизация и управление в машиностроении», № 18, 2002 г.