ПАРАЛЛЕЛЬНАЯ РЕАЛИЗАЦИЯ МЕТОДА ПАЛЬЦЕРА-МАНОЛОПОЛИСА ДЛЯ ВЫЧИСЛЕНИЯ МАТРИЦЫ ПЛОТНОСТИ В ЗАДАЧАХ РАСЧЕТА ЭЛЕКТРОННОЙ СТРУКТУРЫ МОЛЕКУЛ

 

 

А.М.Чернецов, О.Ю. Шамаева

 

 

(Москва, Московский энергетический институт (Технический университет), Россия)

 

 

 

 

В докладе представлены результаты параллельного расчета молекулярных систем большой размерности с использованием класса полуэмпирических методов нулевого дифференциального перекрывания на кластерных системах.

 

Расчеты электронной структуры гигантских молекул являются одними из самых сложных в современной науке и требуют использования высокопроизводительных вычислительных средств таких как суперЭВМ и кластерные установки. Расчеты электронной структуры, в частности, биомолекул (белков, ДНК) и наночастиц, актуальны для ряда областей науки:  химии, биохимии, физики конденсированного состояния вещества и др. В практическом плане эти расчеты важны для фармакологии, нанотехнологий, исследований явлений сверхпроводимости и др.

Основными методами расчетов электронной структуры молекул являются неэмпирические и полуэмпирические методы квантовой химии. Неэмпирические методы расчета требуют слишком больших компьютерных ресурсов. Например, для расчета молекулы небольшого белка цитохром-С (1738 атомов) неэмпирическим методом DFT по специализированной программе ProteinDFT на кластере, содержащем 15 высокопроизводительных микропроцессоров HP Alpha 21264, требуется порядка 24 часов на выполнение одной итерации, а на весь расчет - больше одного месяца, даже без оптимизации геометрии.

Для больших молекулярных систем, содержащих от 103 до 106 атомов, целесообразно применение полуэмпирических методов квантовой химии в так называемом приближении нулевого дифференциального перекрывания [1], в общем случае имеющих асимптотическую сложность расчета O(N3), где N – размерность задачи, пропорциональная числу атомов. Асимптотическая сложность определяется диагонализацией матриц (решением симметричной проблемы собственных значений) и для сверхбольших молекул неприемлема даже при расчетах на суперЭВМ.

Для расчета физико-химических свойств нужны не сами собственные вектора, а матрица плотности P, являющаяся функцией от них. Численный метод прямого нахождения P - purification (“очистка”)-  был разработан еще в 1960 г [2], однако в силу отсутствия в то время необходимых вычислительных ресурсов его применение было ограничено расчетом только небольших молекул. В 90-х гг. ХХ века на основе этого метода были разработаны различные модификации, позволяющие ускорить процесс вычислений. Одной из таких модификаций является метод Пальцера- Манолополиса [3].

Симметричная матрица P является идемпотентной, если P2=P. Мерой идемпотентности может служить величина

 , где tr(P) – след матрицы P.

Метод классической “очистки” McWeeny [2] состоит в проведении итерационного процесса по формуле , где P- матрица плотности. Процесс останавливается при достижении заданной точности по идемпотентности. В результате ряда исследований были найдены более быстро сходящиеся методы, являющиеся модификациями метода классической “очистки”. Одним из них является модификация Пальцера-Манолополиса [3]. В этом методе итерационная формула для нахождения матрицы плотности P выглядит следующим образом:

,

где nномер шага итерационного процесса.

Для повышения эффективности вычислений и учитывая потенциально сверхбольшие размеры матрицы (~106x106 элементов), целесообразно осуществить разбиение матрицы P на блоки и организовать параллельное вычисление блоков на разных процессорах.

В докладе представлены параллельная модификация метода Пальцера-Манолополиса и её реализация на языке Фортран 95 с использованием интерфейса передачи сообщений MPI. В параллельной реализации осуществлено два варианта рассылок – широковещательная рассылка через MPI_Bcast (см. пример на рис.1) и более оптимальная с использованием попарных вызовов MPI_Send/MPI_Recv (см. пример на рис.2).

 

Рис.1. Схема широковещательной рассылки для 6 процессоров (первый процессор рассылает блок остальным пяти).

В случае использования неблокирующихся коммутаторов во 2-ом варианте рассылок возникает дополнительная возможность организовать одновременные пары пересылок, что уменьшает общее время расчета.

 

Рис.2 Схема, иллюстрирующая попарные рассылки блоков матрицы.

Тестирование проводилось в кластере на базе процессоров Intel Xeon Pentium 4/2.6 ГГц с использованием коммуникационной технологии Myrinet 2000 (пиковая пропускная способность 250 Мбайт/c). Тестирование программы производилось на молекуле полипептида с размерностью базиса 7500 (около 3000 атомов). Результаты тестирования для двух способов рассылки приведены в таблице 1.

      Таблица 1.

Широковещательная рассылка

Рассылка send/receive

Число

процессоров

Ускорение

Эффективность

Число

процессоров

Ускорение

Эффективность

3

2.59

0.89

3

2.62

0.88

6

4.37

0.73

6

4.60

0.77

Основные затраты по памяти можно оценить по формуле  байт – для хранения трех матриц порядка NxN (P, P2 и P3 соответственно). Для метода Гоедекера-Коломбо, на основании которого разработана параллельная программа [3] для прямого нахождения матрицы плотности P с применением полиномов Чебышева, затраты по памяти можно оценить как  байт, где p – порядок полинома Чебышева. Оценки приведены для расчетов с двойной точностью.

Таким образом, методы очистки предъявляют значительно меньшие требования к памяти, чем метод Гоедекера-Коломбо. Так, для достижения точности 10-2 уже требуется полином 10-го порядка. Если исходить из требования размещения всей матрицы в памяти узла кластера, то при адресуемом адресном пространства в 2 Гбайт максимально возможная размерность матрицы для расчетов методом Гоедекера-Коломбо составляет порядка 4500х4500, а для методов очистки - порядка 8500х8500.

Авторы выражают благодарность ВЦ имени А.А. Дородницына РАН за возможность использования его кластерных ресурсов для отладки и тестирования программы.

Работа поддержана РФФИ, проект 04-07-90220.

 

ЛИТЕРАТУРА

1.     Степанов Н.Ф. Квантовая механика и квантовая химия. – Изд-ва “Мир” и “МГУ”, М., 2001, 518 с.

2.     McWeeny R., Rev. Mod. Phys. 32, 1960, p.335.

3.     Бобриков В.В., Чернецов А.М., Шамаева О.Ю. Распараллеливание квантово-химических расчетов матрицы плотности с использованием полиномов Чебышева. Труды международной конференции “Информационнные средства и технологии”, 12-14 октября 2004 г., в 3-х т.т. Т1.-М.: Янус-К, 2004.-С.219-222.

4.     Anders M.N. Niklasson, C.J. Tumczak, Matt Challacombe. Trace resetting density matrix purification in O(N) self-consistent-field theory  J. of Chemical Physics, v. 118 N 15, 2003, pp 1-10.