К вакансиям
ML Engineer

AI/LLM Engineer Remote

ID: 35222
9 часов назад
Активна
вне РФ

Требуемый опыт

От 1 года до 3 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#vacancy #job #ai #rag #ml #llm #fastapi Удаленно ВНЕ РФ Вакансия: AI/LLM Engineer В компании сейчас открыта вакансия AI/LLM Engineer (Local Models / RAG / API Development). Команда строит внутреннюю AI-платформу, которая объединяет бизнес-процессы, self-hosted LLM-модели и корпоративные системы. 💼 Формат и условия: - Формат работы: Fully Remote - Работа в международной, финансово устойчивой компании - Взаимодействие с глобальными командами - Возможности международного карьерного роста - Медицинская страховка и конкурентная компенсация 🔧 Основные задачи: - Деплой и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.) - Разработка API-слоя (FastAPI / REST) для работы с моделями - Построение и поддержка RAG-пайплайнов (embeddings, chunking, vector search) - Работа с векторными БД (Chroma, Qdrant, Faiss, Milvus) - Интеграция AI-сервисов с automation workflows (n8n) - Тюнинг промптов и улучшение качества ответов моделей - Мониторинг производительности, latency и ресурсов - Обеспечение безопасной обработки внутренних данных 🛠 Технологический стек: - Python, FastAPI - LLM (Llama / Qwen / Mistral) - RAG, Vector DBs - REST API 🔖 (Nice to have: NVIDIA GPU, LoRA/QLoRA, опыт интеграции AI в automation, data privacy) ✨ Что важно по опыту: - 2+ лет в ML / AI engineering - Практический опыт деплоя и инференса LLM - Уверенные знания Python и API-разработки - Опыт работы с RAG или vector search - Понимание оптимизации производительности систем Проект с сильной инженерной составляющей: вы будете участвовать в создании внутренней AI-платформы с использованием self-hosted моделей и современных подходов к работе с LLM. Если вам интересно — @vladiskashh , жду CV

🛠 Навыки

API layer development
develop RESTful APIs
GPU-accelerated computing
Large language models
low-rank adaptation
Machine learning model deployment
Prompt tuning
Python (computer programming)
retrieval-augmented generation
vector database management

🎯 Домены

AI
LLM
ML

🤖 ИИ навыки

Chroma
Data Privacy
FAISS
FastAPI
Llama
LLM
LoRA
Milvus
Mistral
Model Deployment
model inference
N8N
Prompt tuning
Python (computer programming)
Qdrant
QLoRA
Qwen
RAG
REST API
Vector database

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

AI platform engineering
API Development
Artificial Intelligence
Machine Learning
Natural Language Processing
Self-hosted models
Vector search

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)