Локальный мониторинг

Система локального мониторинга ЦИВК ОИЯИ

Центральный информационно-вычислительный комплекс (ЦИВК, CICC) Объединенного Института Ядерных Исследований (ОИЯИ, JINR) в Лаборатории  информационных технологий (ЛИТ, LIT) состоит из единого вычислительного кластера  (счетных и интерактивных  машин, систем хранения данных,  управляющих и специализированных серверов), включенного в инфраструктуру проекта WLCG (Worldwide LHC Computing Grid). WLCG-сайт ОИЯИ использовался экспериментами LHC на стадии подготовки экспериментов и активно используется на действующей фазе экспериментов как для массового моделирования физических событий, так и для целей физического анализа и хранения реплик данных больших объемов. Локальная сеть ЦИВК построена на базе агрегированных GigabitEthernet-соединений (транков), коммутаторов и маршрутизаторов HP Procurve и Cisco Catalyst.

Для наблюдения за инфраструктурой подобной сложности и её обслуживания необходимо использование системы централизованного локального мониторинга, позволяющей обеспечить круглосуточный контроль всех ресурсов, своевременно оповещающей о сбоях и позволяющей проводить комплексный анализ работы комплекса. Качественная работа подобной системы является важной основой для организации глобального грид-мониторинга, обеспечивая как корректную работу сайта, опирающегося на подконтрольную инфраструктуру, так и предоставление актуальной информации о его работе на более высокие уровни мониторинга. Данные, предоставляемые данной службой, имеют большое значение как для сетевых администраторов, ответственных за предоставление оборудования и каналов, так и для разработчиков и пользователей сервисов grid.

Система локального мониторинга доступна по адресу  http://litmon.jinr.ru. Специальная форма на главной странице позволяет найти нужный объект по известному сетевому имени либо адресу.

В случае возникновения нештатной ситуации (а также и выхода из подобной ситуации) система рассылает лицам, ответственным за проблемные сервисы соответствующие оповещения посредством электронной почты или СМС. Данные, получаемые в результате работы рассмотренной системы мониторинга, неоднократно способствовали выявлению, локализации и устранению сбоев в работе служб ЦИВК, а также оптимизации отдельных его элементов.

Комментарии запрещены.