ML Engineer
AI Engineer Senior Remote
3 дня назад
Активна
4 000 $ - 6 000 $
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
#vacancy #job #AI #remote #senior #cua #AI_engineer #LLM #VLM #researcher
Senior Computer Use AI Agents Engineer (remote)
Compensation: $4,000–6,000/month (depending on experience)
Задачи:
● Разработка и улучшение Computer Use (CUA) агентов: perception, reasoning, planning, action execution.
● Проектирование и обучение LLM/VLM моделей: от дообучения до обучения с нуля (если требуется).
● Построение и поддержка бенчмарков, автотестов и метрик качества для CUI-агентов.
● Разработка пайплайнов, datasets, симуляторов и инструментов для безопасного обучения агентов.
● Оптимизация inference, настройка LoRA/QLoRA, distillation, адаптации под on-premise и ограниченные GPU.
● Работа с RAG, memory, tool-use, multi-agent pipelines.
● Участие в R&D экспериментах, fast-iteration режиме по запуску новых фич.
Требования:
Обязательные:
● Сильный инженерный/исследовательский бэкграунд, идеальный вариант — выпускник топ-университета (Stanford, MIT, Berkeley, ETH, CMU или MIPT).
● Опыт работы в командах крупных AI-игроков (FAANG, OpenAI, Anthropic, DeepMind, xAI, NVIDIA, HuggingFace — или аналогичные масштабные проекты).
● Глубокий опыт в обучении и дообучении LLM и VLM моделей (PyTorch, JAX).
● Практический опыт разработки COMPUTER USE агентов
● Опыт в построении бенчмарков, метрик и системной оценки моделей.
Будет плюсом:
● Опыт применения Reinforcement Learning (RLHF/RLAIF, PPO, DPO, curriculum learning).
● Знание LoRA/QLoRA, quantization, SFT, distillation.
● Публикации по ML/AI (NeurIPS, ICML, ICLR, CVPR, ACL и др).
● Опыт работы с большими датасетами, synthetic data pipelines.
Контакт для связи в телеграм: @foreverinlovewithsummer
🛠 Навыки
distillation
DPO
JAX
LoRA
PPO
PyTorch
QLoRA
quantization
RAG
SFT
🎯 Домены
AI
Computer Use Agents
LLM
Reinforcement Learning
Research
VLM
🤖 ИИ навыки
Benchmarking
Computer Use Agents
Curriculum Learning
distillation
DPO
JAX
LLM
LoRA
Metrics Development
PPO
Python
PyTorch
QLoRA
quantization
RAG
Reinforcement Learning
RLAIF
RLHF
SFT
Synthetic Data Pipelines
VLM
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Agent Systems
AI
Computer Vision
ML
Model Optimization
NLP
Reinforcement Learning
Research
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (2)
Канал:Machinelearning_Jobs