Инженер систем мониторинга
Middle Москва От 3 до 6 лет
Чем предстоит заниматься:
- Сопровождение, администрирование и развитие существующих систем мониторинга (Zabbix, Prometheus, Grafana)
- Настройка сбора метрик со всех уровней ИТ-ландшафта банка (ОС, СУБД, сетевое оборудование, банковское ПО, микросервисы, собственный ЦОД и железо)
- Автоматизация процессов постановки новых сервисов и серверов на мониторинг, в т.ч. с использованием API
- Диагностика и устранение инцидентов, связанных с работой системы мониторинга
- Разработка и поддержка дашбордов в Grafana для дежурных смен, команд сопровождения и инфраструктурных подразделений
- Интеграция с CMDB и системами ITSM
Что мы ждём:
- Опыт работы инженером мониторинга, SRE-специалиста или DevOps с фокусом на observability от 3 лет
- Экспертные знания Zabbix (создание кастомных шаблонов, LLD, пользовательские скрипты, дискавери, оптимизация производительности агентов/прокси)
- Практический опыт работы со стеком Prometheus / VictoriaMetrics (сбор метрик, написание сложных PromQL/MetricsQL запросов).
- Опыт администрирования Linux систем (RHEL, Rocky Linux, AlmaLinux) на уровне уверенного пользователя/администратора
- Знания Python (написание кастомных экспортеров, скриптов автоматизации взаимодействия с API смежных систем, например CMDB)
Будет плюсом:
- Опыт работы с системами класса APM (GMonit, New Relic, Jaeger или аналоги) для мониторинга производительности приложений.
- Знания систем логирования Graylog или OpenSearch (опыт написания поисковых запросов, понимание структуры логов, прикладное администрирование)
- Знание и понимание методологии SRE (определение SLI/SLO/SLA, расчет Error Budgets)
- Опыт администрирования крупных, распределенных систем мониторинга (5000+ объектов / десятки тысяч метрик в секунду)
Как работается в ОТП Банк
Трудоустройство и онбординг
7.9
Финансовое вознаграждение
7.3
Рабочая среда и культура
8.1