ML Engineer
AI/LLM Engineer Remote
ID: 35222
11 часов назад
Активна
вне РФ
Требуемый опыт
От 1 года до 3 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
#vacancy #job #ai #rag #ml #llm #fastapi
Удаленно ВНЕ РФ
Вакансия: AI/LLM Engineer
В компании сейчас открыта вакансия AI/LLM Engineer (Local Models / RAG / API Development). Команда строит внутреннюю AI-платформу, которая объединяет бизнес-процессы, self-hosted LLM-модели и корпоративные системы.
💼 Формат и условия:
- Формат работы: Fully Remote
- Работа в международной, финансово устойчивой компании
- Взаимодействие с глобальными командами
- Возможности международного карьерного роста
- Медицинская страховка и конкурентная компенсация
🔧 Основные задачи:
- Деплой и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.)
- Разработка API-слоя (FastAPI / REST) для работы с моделями
- Построение и поддержка RAG-пайплайнов (embeddings, chunking, vector search)
- Работа с векторными БД (Chroma, Qdrant, Faiss, Milvus)
- Интеграция AI-сервисов с automation workflows (n8n)
- Тюнинг промптов и улучшение качества ответов моделей
- Мониторинг производительности, latency и ресурсов
- Обеспечение безопасной обработки внутренних данных
🛠 Технологический стек:
- Python, FastAPI
- LLM (Llama / Qwen / Mistral)
- RAG, Vector DBs
- REST API
🔖 (Nice to have: NVIDIA GPU, LoRA/QLoRA, опыт интеграции AI в automation, data privacy)
✨ Что важно по опыту:
- 2+ лет в ML / AI engineering
- Практический опыт деплоя и инференса LLM
- Уверенные знания Python и API-разработки
- Опыт работы с RAG или vector search
- Понимание оптимизации производительности систем
Проект с сильной инженерной составляющей: вы будете участвовать в создании внутренней AI-платформы с использованием self-hosted моделей и современных подходов к работе с LLM.
Если вам интересно — @vladiskashh , жду CV
🛠 Навыки
API layer development
develop RESTful APIs
GPU-accelerated computing
Large language models
low-rank adaptation
Machine learning model deployment
Prompt tuning
Python (computer programming)
retrieval-augmented generation
vector database management
🎯 Домены
AI
LLM
ML
🤖 ИИ навыки
Chroma
Data Privacy
FAISS
FastAPI
Llama
LLM
LoRA
Milvus
Mistral
Model Deployment
model inference
N8N
Prompt tuning
Python (computer programming)
Qdrant
QLoRA
Qwen
RAG
REST API
Vector database
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
AI platform engineering
API Development
Artificial Intelligence
Machine Learning
Natural Language Processing
Self-hosted models
Vector search
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:Machinelearning_Jobs