Чем Вы будете заниматься:
проектировать и реализовывать архитектуру AI‑агентов на базе MCP (Model Context Protocol) и RAG (Retrieval‑Augmented Generation), включая микросервисную архитектуру и оркестрацию интеграций;
декомпозировать процессы разработки (код‑ревью, тестирование, рефакторинг) на агентные задачи и стандартизировать связанные с ними процессы — промпт‑инжиниринг, версионирование, тестирование и валидацию результатов;
формировать и обосновывать выбор технологического стека (Java — современные LTS‑версии, Spring Boot, СУБД, брокеры сообщений, инструменты observability) с учётом целевых показателей (latency p99/p95, безопасность, обработка длительных задач);
руководить кросс‑функциональной командой (Java‑разработчики, AI‑инженеры, аналитики): ставить задачи, контролировать сроки и качество, обеспечивать согласованность подходов;
анализировать узкие места в агентной архитектуре (задержки при работе с LLM, стоимость RAG‑запросов, стабильность MCP‑интеграций) и предлагать решения для повышения эффективности и надёжности;
вести архитектурную документацию в общепринятых нотациях (C4, UML, ArchiMate) и отслеживать перспективные технологии (MCP, A2A‑протоколы, оптимизации RAG) для их внедрения в проекты.
Мы ожидаем, что Вы:
имеете не менее 3 лет архитектурного опыта и от 5 лет коммерческой разработки на Java;
уверенно применяете стек Spring Framework 6+ (Spring Boot, Spring AI, WebFlux/MVC, Spring Data, Spring Cloud) на базе Java 17–25;
проектируете MCP‑серверы и реализуете их на Java, глубоко прорабатываете сценарии работы с MCP (resources, tools, prompts, sampling); оптимизируете RAG‑пайплайны (chunking, embedding, retrieval, генерация), в том числе с векторными БД (Qdrant, Milvus, pgvector);
проектируете микросервисную и событийно‑ориентированную архитектуру, разрабатываете API с применением REST, gRPC, AsyncAPI, OpenAPI;
настраиваете и эксплуатируете Kubernetes, работаете с инструментами observability (Prometheus, Grafana, OpenTelemetry); интерпретируете метрики (latency p99/p95, cost per request, precision/recall) и опираетесь на них при принятии архитектурных решений;
визуализируете и документируете архитектуру с помощью нотаций C4, UML (PlantUML) и Mermaid;
ведёте техническую коммуникацию в команде, аргументированно отстаиваете архитектурные решения, управляете конфликтными ситуациями, адаптируетесь к изменениям и сохраняете продуктивность в условиях высокой нагрузки.
Будет плюсом:
Мы предлагаем: