BC/NW 2006, №2, (9) :8.1
СРЕДСТВА МОНИТОРИНГА И ДИАГНОСТИКИ
ИНФОРМАЦИОННО – ВЫЧИСЛИТЕЛЬНОЙ СЕТИ ВУЗА
П.А. Рахман
(Москва, Московский Энергетический Институт,
Российская Федерация)
На сегодняшний день
информационно-вычислительная сеть ВУЗ – это, как правило, довольно сложная,
территориально распределенная и неоднородная вычислительная сеть,
обеспечивающая, в первую очередь, доступ в Интернет, обмен данными внутри ВУЗ,
функционирование корпоративных почтовых и информационных систем, а также доступ
извне к опубликованным информационным ресурсам ВУЗ. Сети крупных ВУЗ включают в
себя до тысячи и более компьютеров конечных пользователей, сотни серверных
систем, большое множество коммутационного оборудования и коммуникационных
кабелей.
В такой ситуации диагностика,
поиск и устранение проблем самого различного рода, возникающих как в
программных, так и в аппаратных компонентах, а также и в линиях связи, являются
одними из важнейших задач для специалистов, обслуживающих ИВС ВУЗ.
Цель данной статьи – дать
краткий обзор средств мониторинга различных технических показателей и
диагностики различных режимов работы как ИВС ВУЗ в целом, так и отдельных ее
узлов, включая конечные компьютеры и коммутационное оборудование.
Средства мониторинга по виду
делятся на специализированные программные средства сторонних производителей,
встроенные в устройство средства аппаратного мониторинга и встроенные в ОС
средства программного мониторинга. По функциональному назначению средства
делятся на средства мониторинга показателей и состояния аппаратных средств,
программного обеспечения, сети, а также средства с комбинированными функциями.
Рассмотрим некоторые из них.
1)
Система NAGIOS [1] от Ethan Galstad – многофункциональная система по сбору информации о
состоянии узлов, сервисов (привязанных к узлам) и групп узлов на основе
использования различных встроенных в систему утилит по проверке доступности
узла, соединения с узлом по конкретному TCP/UDP порту, разрешения DNS-имени
и т.д. Также система NAGIOS предоставляет широкие
возможности по оповещению при обнаружении тех или иных сбоев (недоступность
узла, сервиса и т.п.) – это и оповещение по электронной почте, посылкой
сообщения по сети конкретному узлу, SMS-сообщение на телефон и т.п.
Система обладает гибкими возможностями по построению графа сети со всеми
необходимыми связями между узлами, для возможности визуальной оценки состояния
сети, система обеспечивает сбор статистики о сбоях в сети с возможностью
формирования отчета за конкретный период. Система предоставляет доступ к ней
через WEB-интерфейс и имеет встроенную систему авторизации по именам
пользователям и их паролям, и IP-адресов компьютеров
пользователей.
2)
Система SOLARWINDS Orion Network Performance Monitor [2] – чрезвычайно гибкая,
многофункциональная система сбора информации по протоколу SNMP.
Обеспечивает мониторинг узлов и множества параметров, собираемых в рамках
протокола SNMP. Это, как минимум: загрузка процессора, загрузка
памяти, загрузка дисков, состояние узла и всех его сетевых интерфейсов,
скорости приема и передачи данных, как мгновенные, так и средние, суммарные
объемы передаваемых и принимаемых данных за контрольный период. А также ошибки на интерфейсах,
базовые сведения об узле и установленной на нем операционной системе и многое другое.
Система предоставляет доступ через WEB-интерфейс, использует
собственную систему авторизации, метаданные и данные хранятся БД MS SQL Server. Кроме того, система также
позволяет строить и интерактивно отображать карту сети (граф сети, точнее
какую-то его ключевую часть). Система также обладает развитой системой сбора
статистической информации по многим показателям и генерации отчетов за
произвольные контрольные периоды. Кроме того, система имеет гибкую систему
оповещения, причем не только оповещение о недоступности узлов или какого-то его
интерфейса, но и также при выходе какого-либо контролируемого параметра за
пределы заданного специалистом диапазон, например, оповещение превышение
загрузки процессора заданного порога, превышение на интерфейсе заданного порога
скорости передачи данных и т.п.
3)
Встроенные средства управления и мониторинга коммутационного
оборудования. Современные аппаратные маршрутизаторы (Cisco) и интеллектуальные
коммутаторы имеют достаточно развитое и гибкое программное обеспечение, которое
помимо основных функций также предоставляет возможности по настройке,
мониторингу и управлению коммутационных устройств удаленно (чаще используется
доступ через WEB-интерфейс, TELNET и т.п. с собственной
системой авторизации). Средства для удаленного мониторинга и управления
коммутационным устройством позволяет не только оперативно конфигурировать
устройство, но и своевременно выявлять ошибки при передаче данных, обнаруживать
широковещательный шторм, повышенную и подозрительную активность на интерфейсах,
и принимать соответствующие меры, например, блокировка порта коммутатора.
Наличие возможности удаленного просмотра состояния буферов и загрузки
процессора коммутатора позволяет выявлять узкие места в сети, или на каком-то
конкретном участке сети.
4)
Сетевые (пакетные) анализаторы для детального изучения передаваемых и
принимаемых данных: заголовков Ethernet [3], IP, TCP и
заголовков прикладного уровня, адресов отправителя и получателей, TCP/UDP
портов отправителя и получателя, содержимого в поле данных и многого другого.
На сегодняшний день специалистами ИВЦ используются встроенная в ОС Windows
утилита Network Monitor и утилита Ethereal
стороннего производителя. По функциональным возможностям утилиты довольно
похожи, хотя, конечно же, у Ethereal возможности шире. Тем
более, что версии Ethereal регулярно обновляются и возможности наращиваются.
Анализаторы пакетов в реально масштабе времени перехватывают пакеты, проходящие
через сетевые интерфейсы узла-исследователя (причем сетевые интерфейсы
переходят в “прозрачный” режим, и пакеты перехватываются даже в том случае,
если они не предназначены узлу). Анализаторы пакетов позволяет обнаруживать
такие важные вещи как: постоянная атака на узлы со случайным и последовательным
перебором адресов узлов, источники больших объемов широковещательных пакетов,
целенаправленная непрерывная атака на конкретный узел. Ну и, конечно же,
анализаторы используются для детального выяснения причин тех или иных сетевых
проблем: когда кто-то с кем-то не может установить соединение, или происходит
обрыв соединения, или имеет место быть отказ в обслуживании по запросу.
Анализаторы также имеют развитые и гибкие механизмы фильтрации.
5)
Встроенный в ОС монитор производительности (Performance Monitor).
OC MS Windows Server
[4] имеет множество классов: процессор, диск, память, процесс, поток, сетевой
протокол и множество других, и для каждого класса определены наборы счетчиков
производительности. Для тех классов, для которых имеется не один, а множество
экземпляров класса (например, множество конкретных процессов, множество
конкретных дисков и т.п.) можно отслеживать счетчики отдельно для каждого
экземпляра класса. Все это, позволяет отслеживать состояние системы, отдельных
компонент, отдельных работающих приложений и служб, по огромному количеству
счетчиков производительности.
6)
Специализированные утилиты мониторинга системы. Например, набор утилит
от SYSINTERNALS [5] для ОС MS Windows,
включает в себя множество полезных утилит для анализа работы системы, в том
числе программные мониторы:
- Process Explorer – наиболее мощное средство для отслеживание
активности выполняющихся процессов по множеству параметрам.
- Registry Monitor – утилита мониторинга обращения к реестру ОС.
- File Monitor – утилита мониторинга операций с файлами.
- Disk Monitor – утилита мониторинга операций с жестким диском.
- TDI Monitor – утилита мониторинга сетевой активности по
протоколам TCP/UDP, отслеживание
устанавливаемых и разрываемых соединений.
7)
Средства мониторинга работы аппаратных средств компьютеров и
коммутационного оборудования. В компьютерах, на которых функционируют серверные
системы, чрезвычайную важность имеет работоспособность, в первую очередь,
жестких дисков, материнской платы, процессора, оперативной памяти и блока
питания. Большинство материнских плат на сегодняшний день имеют встроенные
схемы контроля, а также датчики температуры, напряжений и скорости вращения
вентиляторов для отвода тепла. Соответственно, в комплект программного
обеспечения, поставляемого с материнской платой, входят утилиты для мониторинга
тех или иных показателей, получаемых с датчиков.
За годы эксплуатации
информационно-вычислительной сети МЭИ (ТУ) вышеперечисленные средства
мониторинга показали высокую эффективность и гибкость при поиске и устранении
проблем с аппаратными средствами, программным обеспечением и сетевым
оборудованием, а также позволили заранее выявить ряд несоответствий и
предотвратить множество проблем в ИВС.
ЛИТЕРАТУРА
5. http://www.sysinternal.com/