BC/NW 2006, №1, (8) : 17.8
АРХИТЕКТУРА ГЛОБАЛЬНО-РАСПРЕДЕЛЕННОЙ СЕТИ ДЛЯ
РЕАЛИЗАЦИИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ
И.И. Дзегеленок, П.Е. Ильин
(Москва, Московский
энергетический институт (технический университет), Россия)
В настоящее время одним из направления развития
информационных технологий являются распределенные вычисления, которые позволяют
повысить эффективность решения ряда задач за счет обработки данных по месту их
возникновения. Параллельная мультикомпьютерная сеть (ПМК-сеть) являются одним
из возможных способов реализации распределенных вычислений. ПМК-сеть
представляет собой программную среду, выполняемую на некотором множестве
вычислителей (специализированных или неспециализированных компьютеров),
которая создает инфраструктуру для выполнения распределенных задач, взяв на
себя следующие функции:
1)
изоляцию
логических адресов вычислителей от топологии сети, что дает возможность
прикладным задачам выполнять адресацию на уровне номеров параллельных процессов
при выполнении обменов
2)
низкоуровневую
работу с сетями передачи данных и обработку ошибок
3)
сбор информации о
доступных вычислителях и распределение задач по вычислителям
4)
обеспечение
отказоустойчивости в процессе решения задачи
5)
сбор отладочной
информации о задачах в процессе их решения
6)
административные
функции и удаленный запуск параллельных процессов задачи
При реализации ПМК-сети существуют два подхода:
децентрализованный и централизованный. При децентрализованном подходе в сборе
информации о доступных вычислителях и распределении задач участвуют все
вычислители. Такой подход может эффективно применяться в одноранговых локальных
сетях, где возможна рассылка широковещательных сообщений. На кафедре ВМСиС на
данный момент разработана децентрализованная ПМК-сеть КУРС-2000 [1].
Централизованный
подход может применяться как в локальных, так и в глобальных сетях, в
частности, в Internet. ПМК-сеть с централизованной организацией состоит
из отдельного центрального сервера и локальных диспетчеров, выполняющихся на
вычислителях. Функции центрального сервера –
сбор информации о доступных вычислителях, и распределение по ним задач,
и сбор отладочной информации. Функции локальных диспетчеров – удаленный запуск
задач, обеспечение взаимодействия между процессами прикладных задач, передача
центральному серверу отладочной информации
[2].
Отказоустойчивость
задач, выполняемых на ПМК-сети, обеспечивается следующим образом: вся задача
разбивается на этапы. При завершении очередного этапа серверу отправляется
уведомление. В случае отказа одного из вычислителей центральный сервер
производит рассылку уведомлений оставшимся процессам и выбор вычислителя для запуска новой копии
отказавшего процесса с начала этапа, на котором произошел отказ.
Таким
образом, создание ПМК-сети с применением централизованного подхода и
реализацией локальных диспетчеров в виде отдельных процессов (такая ПМК-сеть
получила название нелокальной) позволит существенно расширить класс решаемых
задач за счет снятия требования одноранговой сети передачи данных, упростить
разработку и отладку параллельных программ, а также контроль за ходом их
выполнения. В настоящее время на кафедре ВМСиС ведется разработка такой
ПМК-сети, получившей название КУРС-2004.
Литература
1.
Дзегеленок И.И.,
Кузнецов А.Ю. Параллельные мультикомпьютерные сети как направление развития
распределенных супер-ЭВМ// Сб. "Системы управления и силовая
электроника"/ Под общ ред. В.Д.Ковалёва.-М.:ВЭИ.-2001, с.62-67
2. Дзегеленок И.И., Ильин
П.Е. и др. Декомпозиционный подход к осуществлению GRID-технологий//
Научно-технический журнал
«Информационная математика»– М.: Изд-во
«АСТ-Физико-математическая литература», № 1(5), 2005, с.110–119