Что можно "выжить" из системы мониторига оборудования?
Я предлагаю посмотреть на процесс управления с другой точки зрения. Зная заранее о взаимосвязях в системе управления - вы сможете планировать последствия нештатных ситуаций и деградацию отдельных параметров управляемой системы. Это принцип управления работающий на опережение текущих событий. Он позволяет предвидеть аварии, авралы, проблемы, конфликтные ситуации. Что же тогда мешает нам реализовывать данный подход?
Часто мы слышим такой ответ:
1) Сложность настройки системы, сбора, хранения и обработки информации.
2) Дороговизна системы
3) Сложный интерфейс
4) Сложность поддержки в актуальном состоянии
фото с сайта AMT.ru
Наша цель: существенно увеличить степень доступности ИТ сервисов и сократить время развертывания системы управления и расходов на ее обслуживание.
Мы решили заняться этим вопросом в 2015 году. После опыта эксплуатации ИТ инфраструктуры в компаниях различного масштаба от небольших операторов связи до мобильных операторов, мы задумались о выработке новых подходов к мониторингу и управлению.
Принципы:
1) Отсутствие лишней информации на экране и максимально удобная навигация по данным в конкретном представлении системы
2) Мы фиксируем в БД как изменения самих параметров, так и структуры системы
3) Максимальная степень анонимности данных и надёжность хранения данных
4) Высокая производительность и доступность как backend так fronend частей
5) Наглядность работы с данными и ботами
6) Возможность анализировать тенденции, коридоры значений, статистического распределения данных
7) Возможность формирования типовых реакций на цепочку изменений набора параметров, отслеживание причинно-следственных связей
В результате спроектировали первую версию системы - ядро. Она была локальной и сильно упрощенной.
Локальная версия обладала рядом ограничений: возможностью полноценного масштабирования под нагрузкой.
Сейчас готовится к выпуску вторая версия системы - облачный сервис FocusData.