BC/NW 2006, №2, (9) :8

BC/NW 2006, №2, (9) :8.1

СРЕДСТВА МОНИТОРИНГА И ДИАГНОСТИКИ ИНФОРМАЦИОННО – ВЫЧИСЛИТЕЛЬНОЙ СЕТИ ВУЗА

П.А. Рахман

(Москва, Московский Энергетический Институт, Российская Федерация)

На сегодняшний день информационно-вычислительная сеть ВУЗ – это, как правило, довольно сложная, территориально распределенная и неоднородная вычислительная сеть, обеспечивающая, в первую очередь, доступ в Интернет, обмен данными внутри ВУЗ, функционирование корпоративных почтовых и информационных систем, а также доступ извне к опубликованным информационным ресурсам ВУЗ. Сети крупных ВУЗ включают в себя до тысячи и более компьютеров конечных пользователей, сотни серверных систем, большое множество коммутационного оборудования и коммуникационных кабелей.

В такой ситуации диагностика, поиск и устранение проблем самого различного рода, возникающих как в программных, так и в аппаратных компонентах, а также и в линиях связи, являются одними из важнейших задач для специалистов, обслуживающих ИВС ВУЗ.

Цель данной статьи – дать краткий обзор средств мониторинга различных технических показателей и диагностики различных режимов работы как ИВС ВУЗ в целом, так и отдельных ее узлов, включая конечные компьютеры и коммутационное оборудование.

Средства мониторинга по виду делятся на специализированные программные средства сторонних производителей, встроенные в устройство средства аппаратного мониторинга и встроенные в ОС средства программного мониторинга. По функциональному назначению средства делятся на средства мониторинга показателей и состояния аппаратных средств, программного обеспечения, сети, а также средства с комбинированными функциями. Рассмотрим некоторые из них.

1) Система NAGIOS [1] от Ethan Galstad – многофункциональная система по сбору информации о состоянии узлов, сервисов (привязанных к узлам) и групп узлов на основе использования различных встроенных в систему утилит по проверке доступности узла, соединения с узлом по конкретному TCP/UDP порту, разрешения DNS-имени и т.д. Также система NAGIOS предоставляет широкие возможности по оповещению при обнаружении тех или иных сбоев (недоступность узла, сервиса и т.п.) – это и оповещение по электронной почте, посылкой сообщения по сети конкретному узлу, SMS-сообщение на телефон и т.п. Система обладает гибкими возможностями по построению графа сети со всеми необходимыми связями между узлами, для возможности визуальной оценки состояния сети, система обеспечивает сбор статистики о сбоях в сети с возможностью формирования отчета за конкретный период. Система предоставляет доступ к ней через WEB-интерфейс и имеет встроенную систему авторизации по именам пользователям и их паролям, и IP-адресов компьютеров пользователей.

2) Система SOLARWINDS Orion Network Performance Monitor [2] – чрезвычайно гибкая, многофункциональная система сбора информации по протоколу SNMP. Обеспечивает мониторинг узлов и множества параметров, собираемых в рамках протокола SNMP. Это, как минимум: загрузка процессора, загрузка памяти, загрузка дисков, состояние узла и всех его сетевых интерфейсов, скорости приема и передачи данных, как мгновенные, так и средние, суммарные объемы передаваемых и принимаемых данных за контрольный период. А также ошибки на интерфейсах, базовые сведения об узле и установленной на нем операционной системе и многое другое. Система предоставляет доступ через WEB-интерфейс, использует собственную систему авторизации, метаданные и данные хранятся БД MS SQL Server. Кроме того, система также позволяет строить и интерактивно отображать карту сети (граф сети, точнее какую-то его ключевую часть). Система также обладает развитой системой сбора статистической информации по многим показателям и генерации отчетов за произвольные контрольные периоды. Кроме того, система имеет гибкую систему оповещения, причем не только оповещение о недоступности узлов или какого-то его интерфейса, но и также при выходе какого-либо контролируемого параметра за пределы заданного специалистом диапазон, например, оповещение превышение загрузки процессора заданного порога, превышение на интерфейсе заданного порога скорости передачи данных и т.п.

3) Встроенные средства управления и мониторинга коммутационного оборудования. Современные аппаратные маршрутизаторы (Cisco) и интеллектуальные коммутаторы имеют достаточно развитое и гибкое программное обеспечение, которое помимо основных функций также предоставляет возможности по настройке, мониторингу и управлению коммутационных устройств удаленно (чаще используется доступ через WEB-интерфейс, TELNET и т.п. с собственной системой авторизации). Средства для удаленного мониторинга и управления коммутационным устройством позволяет не только оперативно конфигурировать устройство, но и своевременно выявлять ошибки при передаче данных, обнаруживать широковещательный шторм, повышенную и подозрительную активность на интерфейсах, и принимать соответствующие меры, например, блокировка порта коммутатора. Наличие возможности удаленного просмотра состояния буферов и загрузки процессора коммутатора позволяет выявлять узкие места в сети, или на каком-то конкретном участке сети.

4) Сетевые (пакетные) анализаторы для детального изучения передаваемых и принимаемых данных: заголовков Ethernet [3], IP, TCP и заголовков прикладного уровня, адресов отправителя и получателей, TCP/UDP портов отправителя и получателя, содержимого в поле данных и многого другого. На сегодняшний день специалистами ИВЦ используются встроенная в ОС Windows утилита Network Monitor и утилита Ethereal стороннего производителя. По функциональным возможностям утилиты довольно похожи, хотя, конечно же, у Ethereal возможности шире. Тем более, что версии Ethereal регулярно обновляются и возможности наращиваются. Анализаторы пакетов в реально масштабе времени перехватывают пакеты, проходящие через сетевые интерфейсы узла-исследователя (причем сетевые интерфейсы переходят в “прозрачный” режим, и пакеты перехватываются даже в том случае, если они не предназначены узлу). Анализаторы пакетов позволяет обнаруживать такие важные вещи как: постоянная атака на узлы со случайным и последовательным перебором адресов узлов, источники больших объемов широковещательных пакетов, целенаправленная непрерывная атака на конкретный узел. Ну и, конечно же, анализаторы используются для детального выяснения причин тех или иных сетевых проблем: когда кто-то с кем-то не может установить соединение, или происходит обрыв соединения, или имеет место быть отказ в обслуживании по запросу. Анализаторы также имеют развитые и гибкие механизмы фильтрации.

5) Встроенный в ОС монитор производительности (Performance Monitor). OC MS Windows Server [4] имеет множество классов: процессор, диск, память, процесс, поток, сетевой протокол и множество других, и для каждого класса определены наборы счетчиков производительности. Для тех классов, для которых имеется не один, а множество экземпляров класса (например, множество конкретных процессов, множество конкретных дисков и т.п.) можно отслеживать счетчики отдельно для каждого экземпляра класса. Все это, позволяет отслеживать состояние системы, отдельных компонент, отдельных работающих приложений и служб, по огромному количеству счетчиков производительности.

6) Специализированные утилиты мониторинга системы. Например, набор утилит от SYSINTERNALS [5] для ОС MS Windows, включает в себя множество полезных утилит для анализа работы системы, в том числе программные мониторы:

- Process Explorer – наиболее мощное средство для отслеживание активности выполняющихся процессов по множеству параметрам.

- Registry Monitor – утилита мониторинга обращения к реестру ОС.

- File Monitor – утилита мониторинга операций с файлами.

- Disk Monitor – утилита мониторинга операций с жестким диском.

- TDI Monitor – утилита мониторинга сетевой активности по протоколам TCP/UDP, отслеживание устанавливаемых и разрываемых соединений.

7) Средства мониторинга работы аппаратных средств компьютеров и коммутационного оборудования. В компьютерах, на которых функционируют серверные системы, чрезвычайную важность имеет работоспособность, в первую очередь, жестких дисков, материнской платы, процессора, оперативной памяти и блока питания. Большинство материнских плат на сегодняшний день имеют встроенные схемы контроля, а также датчики температуры, напряжений и скорости вращения вентиляторов для отвода тепла. Соответственно, в комплект программного обеспечения, поставляемого с материнской платой, входят утилиты для мониторинга тех или иных показателей, получаемых с датчиков.

За годы эксплуатации информационно-вычислительной сети МЭИ (ТУ) вышеперечисленные средства мониторинга показали высокую эффективность и гибкость при поиске и устранении проблем с аппаратными средствами, программным обеспечением и сетевым оборудованием, а также позволили заранее выявить ряд несоответствий и предотвратить множество проблем в ИВС.

ЛИТЕРАТУРА

1. http://www.nagios.org/

2. http://www.solarwinds.net/

3. http://www.ethereal.com/

4. http://www.microsot.com

5. http://www.sysinternal.com/