Главная Вакансии Компании Рейтинги О портале

Техлид группы AIaaS (AIaaS techlead)

Lead / Manager Санкт-Петербург От 3 до 6 лет
Опыт
От 3 до 6 лет
Город
Санкт-Петербург
Опубликована
23.06.2026

Как международный Managed IT Service провайдер, мы развиваем направление AI as a Service (AIaaS): единый шлюз доступа к языковым моделям (LLM) и сопутствующим AI-инструментам с маршрутизацией запросов, аутентификацией, квотированием, учётом потребления токенов, мониторингом доступности и агрегацией логов. Услуга предоставляет клиентам единую точку входа (OpenAI-совместимый API и веб-интерфейс) ко множеству моделей в рамках одного договора, а инфраструктуру, масштабирование, обновление версий и безопасность данных обеспечиваем мы.

Ищем технического лидера, который возглавит группу AI as a Service: будет развивать услугу на базе AI-инструментов, в том числе собственной разработки (Ainergy), обеспечивать их стабильную работу 24×7 и точечно усиливать смежные услуги (Managed IT, Managed DevOps).

В первую очередь нам важен сильный технический специалист с уверенным знанием Linux, контейнеризации и оркестрации контейнеров, который не боится сам погружаться в код, инфраструктуру и решать инциденты.

Чем предстоит заниматься:
  • Развитие и эксплуатация платформы AIaaS и AI-инструментов собственной разработки (Ainergy): API-шлюз, маршрутизация к моделям, аутентификация, квотирование, учёт токенов;
  • Развёртывание и сопровождение инференса языковых моделей (как проприетарных, так и open-source) в контейнерах под управлением Docker или Kubernetes на GPU-инфраструктуре;
  • Обеспечение высокой доступности, масштабируемости и предсказуемой производительности сервисов в режиме 24×7;
  • Контроль автоматизации рутинных задач и процессов для обеспечения стабильности и минимизации человеческого фактора;
  • Организация мониторинга, алертинга и реагирования на инциденты с использованием Prometheus/VictoriaMetrics, Grafana, ELK;
  • Подключение новых LLM-моделей и поддержание совместимости интеграций для клиентов без изменения их кода;
  • Взаимодействие с командами разработки и смежными группами (Managed IT, Managed DevOps ) для быстрой адаптации сервисов под меняющиеся требования бизнеса;
  • Участие в согласовании архитектуры, выборе инструментов и стандартов, развитие центра компетенций группы;
  • Продвижение культуры применения AI внутри компании: личный пример активного использования AI-инструментов в повседневной работе, помощь командам во внедрении AI в их процессы, обмен практиками и обучение коллег.
Мы ждём, что вы:
  • Уверенно владеете Linux: понимаете архитектуру ОС, умеете находить и устранять проблемы в работающем ПО, разворачивать и сопровождать практически любое Open-Source ПО;
  • Имеете глубокий практический опыт контейнеризации (Docker) и оркестрации контейнеров (Kubernetes): деплой, сети, хранилища, ресурсные лимиты, отказоустойчивость;
  • Свободно владеете bash, пишете автоматизацию на Python (или готовы быстро её освоить);
  • Понимаете принципы работы сетей (TCP/IP, Ethernet), балансировки нагрузки (Nginx, HAProxy) и настройки безопасных соединений (SSL/TLS);
  • Имеете опыт администрирования СУБД (PostgreSQL и др.) и работы с системами мониторинга и логирования (Prometheus, Grafana, ELK);
  • Имеете опыт работы с системами управления конфигурацией (Ansible) и подходом IaC;
  • Готовы быть техническим лидером: отвечать на любой технический вопрос подчинённых, развивать сильные стороны команды и выстраивать эффективные процессы работы;
  • Умеете координировать задачи между командами, находить баланс между техническими и бизнес-требованиями и обеспечивать выполнение в срок;
  • Сами активно используете AI-инструменты в повседневной работе и продвигаете их применение среди коллег, помогая командам работать быстрее и эффективнее;
  • Знаете английский язык на уровне, достаточном для работы с ПО, чтения документации и текстовой коммуникации.
Будет здорово, если:
  • У вас есть опыт работы с LLM и AI-инструментами: инференс-серверы (vLLM, Ollama, Triton, TGI), OpenAI-совместимые API, токенизация, эмбеддинги и векторные БД, RAG-пайплайны;
  • Вы работали с GPU-инфраструктурой (NVIDIA/CUDA) и понимаете специфику планирования и шеринга GPU в Kubernetes;
  • У вас есть опыт построения и эксплуатации API-шлюзов: маршрутизация, rate limiting, квоты, мультитенантность;
  • Вы понимаете концепции Cloud-native, микросервисной архитектуры и IaC (Terraform, Ansible);
  • Вы знакомы с DevOps-практиками и CI/CD (GitLab CI, Jenkins) и понимаете услугу Managed DevOps;
  • У вас есть опыт работы по процессам ITIL/ITSM и понимание того, как применять их для улучшения управления IT-услугами;
  • Вы знакомы с системами управления идентификацией (FreeIPA, Keycloak);
  • Вы стремитесь постоянно улучшать процессы и готовы предлагать новые идеи и решения.
Технологический стек:
  • LLM: GPT, Claude, Llama, Mistral, Qwen, Gemini, DeepSeek и др.;
  • Инференс и AI-инструменты: vLLM, Ollama, Triton, OpenAI-совместимые API, векторные БД;
  • Linux (Oracle Linux, Ubuntu);
  • Docker + Kubernetes;
  • GitLab + GitLab CI;
  • Ansible + Terraform;
  • Icinga2 + VictoriaMetrics + Prometheus + Grafana;
  • ELK Stack;
  • FreeIPA + Keycloak;
  • PostgreSQL + MongoDB + Redis;
  • Nginx + HAProxy;
  • RabbitMQ + Kafka;
  • PowerDNS;
  • Jira + Confluence.
Работа у нас — это:
  • Возможность реализовать свои идеи и строить AI-платформу собственной разработки;
  • Талантливая команда, готовая поддержать ваши инициативы;
  • Мощное железо и всё для продуктивной работы, включая GPU-ресурсы;
  • Прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
  • Обучение за счёт компании: мы оплачиваем профильные курсы, сертификации и участие в конференциях и мастер-классах;
  • Красивый и комфортный офис, а также возможность работать удалённо;
  • У нас есть IT-аккредитация.

Мы постарались вместить в описание больше деталей, но нам всё ещё есть, что рассказать. Будем рады познакомиться!

Как работается в ITG Corporation
Трудоустройство и онбординг
6.5
Финансовое вознаграждение
5.5
Рабочая среда и культура
4.8
Карьерная ценность
7.5
Другие вакансии ITG Corporation
Junior C# разработчик
Санкт-Петербург