T2 внедрила новую систему мониторинга, которая следит за состоянием сети и оборудования. Главный практический результат — скорость реагирования на неполадки выросла в 2,7 раза. Проще говоря, если раньше на поиск и устранение сбоя уходило, условно, полтора часа, то теперь — около получаса. Кроме того, система устроена так, что при выходе из строя целого дата-центра сервисы продолжают работать автоматически: управление перехватывает резервная площадка без участия оператора. Это значит, что даже серьёзная авария не оставит абонентов без связи. Разработка построена на российском продукте «Пульт» от «Лаборатории Числитель», который, в свою очередь, базируется на ядре Zabbix. Систему спроектировали и внедрили Т2 совместно с ИТ-компанией «Инфосистемы Джет». Архитектура распределена между тремя дата-центрами и двенадцатью площадками. Это нужно для того, чтобы отказ одного узла не обрушил всю сеть. Сейчас решение отслеживает состояние более 30 тысяч объектов по всей стране и обрабатывает до 15 миллионов метрик — параметров, по которым можно судить о работе инфраструктуры: от загрузки процессора до качества сигнала.
Данные собираются через прокси-серверы, а хранятся в гибридной связке PostgreSQL и ClickHouse. Такой подход позволяет быстро обрабатывать текущие запросы и хранить историю за семь лет. Архитектура изначально спроектирована с запасом под трёхкратный рост объёмов, чтобы не перестраивать систему по мере расширения сети. Необходимость модернизации в компании объясняют тем, что любые сбои в инфраструктуре напрямую влияют на абонентов, а объёмы данных постоянно растут. Проект получил премию Digital Leaders 2026 как «Решение года» в категории «ИТ-инфраструктура». Церемония прошла 27 мая в Москве на форуме «Время цифры». Жюри отметило архитектуру импортонезависимого решения. Директор по стратегическому развитию сети Т2 Павел Ковальский сообщил, что система готова к дальнейшему масштабированию без архитектурных изменений. Руководитель направления мониторинга «Инфосистемы Джет» Алексей Акопян добавил, что решение сохраняет работоспособность даже при серьёзных отказах. Разработчики «Пульта» уточнили, что доработки продукта позволили в три раза увеличить мощности по сбору данных и в десять раз оптимизировать их хранение по сравнению со стандартным Zabbix.
