К вакансиям
ML Engineer

Lead AI Engineer LLM Remote

ID: 29021
13 февраля 2026 г.
Активна
Neoflex
Россия
300 000 ₽ - 500 000 ₽

Тип занятости

Полная занятость

Требуемый опыт

От 3 до 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

Аккредитованная IT компания Neoflex ищет 🔥 Lead AI Engineer / AI Architect (LLM) 🔥 🔍 Компания: Neoflex консалтинг 🔍 Занятость: полная 🔍 Локация: удалёнка РФ 💥 ЗП: от 300 до 500к в зависимости от опыта ✅ Оформление: по ТК РФ бессрочный трудовой договор Мы развиваем направление LLM/GenAI и ищем инженера, который станет техническим лидером для нескольких продуктовых команд: поможет проектировать LLM‑системы (включая агентные workflow), выстроит подходы к оценке качества и надёжности, и будет помогать командам стабильно доводить решения до промышленной эксплуатации. Если вы не совпадаете со всеми пунктами, но вам близки сложные агентные workflow и вы понимаете, как выстраивать валидацию и observability — откликайтесь. 💥 Стек проекта: Python, PyTorch, LangChain/LangGraph, Milvus/Weaviate/etc, Triton/vLLM, LangFuse, LiteLLM, FastAPI, GitLab CI, SQL. Чем предстоит заниматься: Помогать командам с архитектурой и системным дизайном: reference‑подходы, дизайн‑ревью, стандарты, best practices для нескольких продуктовых команд. Проектировать и улучшать агентные решения: выбирать паттерны (router, planner/executor, ReAct и т.п.), проектировать tool use, structured output, orchestration (workflow/graph/state machine), безопасные контуры выполнения. Выстраивать качество и надёжность: метрики, бенчмарки и regression‑проверки, A/B‑эксперименты, мониторинг, guardrails, observability (трейсинг/логирование/алерты). Оптимизировать производительность и стоимость инференса (latency/cost), помогать командам с production‑готовностью (SLA, стабильность, масштабирование). Курировать R&D‑прототипы и доводить их до продукта; менторить коллег, развивать инженерную экспертизу (митапы/хакатоны — по желанию). Что мы ждём от вас (must-have): 3+ лет коммерческого опыта в software engineering / backend / AI/ML инженерии, из них 2+ года в LLM/GenAI‑проектах (в проде). Уверенное владение Python, SQL, Git и хорошее понимание инженерных практик разработки (архитектура сервисов, тестирование, CI/CD, эксплуатация). Опыт внедрения и поддержки в промышленной эксплуатации решений на базе LLM (включая мониторинг/инциденты/качество/стоимость). Опыт построения систем оценки качества LLM/agent решений: метрики, датасеты/бенчмарки, автоматизированные проверки, A/B‑эксперименты, интерпретация результатов. Опыт технического лидерства: дизайн/архитектурные решения, координация с командами, взаимодействие с заказчиками, защита/аргументация технических решений. Будет плюсом: Опыт построения AI‑платформ, фреймворков, SDK или внутренних библиотек/компонентов для команд. Опыт оптимизации и/или кастомизации инференса (vLLM/Triton/квантизация/батчинг/кэширование). Опыт fine‑tuning / PEFT (LoRA/QLoRA) или дообучения эмбеддеров/реранкеров. Опыт работы с мультимодальными и речевыми моделями (VLM, ASR, TTS). Вклад в open‑source, публикации/выступления на конференциях. Умение объяснять сложные вещи простым языком и переводить требования бизнеса в технические метрики качества. 👌🏻 Если вакансия заинтересовала, пишите в л/с @HelenaList вкладывайте своё резюме, отправляйте ссылку на hh как вам удобно 😊 За рекомендацию нашей вакансии плюсик в карму 😍 #Lead #Engineer #Architect #LLM

🛠 Навыки

FastAPI
LangChain
Langfuse
LangGraph
LiteLLM
Milvus
project configuration management
Python (computer programming)
software components libraries
SQL
tools for software configuration management
vLLM
Weaviate

🎯 Домены

AI
Data Science
ML

🤖 ИИ навыки

monitor production developments
observe logs
Python (computer programming)
software components libraries
SQL
System Design
tools for software configuration management

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Generative artificial intelligence
Large language model
Machine Learning
Natural Language Processing
Software Engineering

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации