К вакансиям
ML Engineer

AI Engineer Senior Remote

2 дня назад
Активна
4 000 $ - 6 000 $

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#vacancy #job #AI #remote #senior #cua #AI_engineer #LLM #VLM #researcher Senior Computer Use AI Agents Engineer (remote) Compensation: $4,000–6,000/month (depending on experience) Задачи: ● Разработка и улучшение Computer Use (CUA) агентов: perception, reasoning, planning, action execution. ● Проектирование и обучение LLM/VLM моделей: от дообучения до обучения с нуля (если требуется). ● Построение и поддержка бенчмарков, автотестов и метрик качества для CUI-агентов. ● Разработка пайплайнов, datasets, симуляторов и инструментов для безопасного обучения агентов. ● Оптимизация inference, настройка LoRA/QLoRA, distillation, адаптации под on-premise и ограниченные GPU. ● Работа с RAG, memory, tool-use, multi-agent pipelines. ● Участие в R&D экспериментах, fast-iteration режиме по запуску новых фич. Требования: Обязательные: ● Сильный инженерный/исследовательский бэкграунд, идеальный вариант — выпускник топ-университета (Stanford, MIT, Berkeley, ETH, CMU или MIPT). ● Опыт работы в командах крупных AI-игроков (FAANG, OpenAI, Anthropic, DeepMind, xAI, NVIDIA, HuggingFace — или аналогичные масштабные проекты). ● Глубокий опыт в обучении и дообучении LLM и VLM моделей (PyTorch, JAX). ● Практический опыт разработки COMPUTER USE агентов ● Опыт в построении бенчмарков, метрик и системной оценки моделей. Будет плюсом: ● Опыт применения Reinforcement Learning (RLHF/RLAIF, PPO, DPO, curriculum learning). ● Знание LoRA/QLoRA, quantization, SFT, distillation. ● Публикации по ML/AI (NeurIPS, ICML, ICLR, CVPR, ACL и др). ● Опыт работы с большими датасетами, synthetic data pipelines. Контакт для связи в телеграм: @foreverinlovewithsummer

🛠 Навыки

distillation
DPO
JAX
LoRA
PPO
PyTorch
QLoRA
quantization
RAG
SFT

🎯 Домены

AI
Computer Use Agents
LLM
Reinforcement Learning
Research
VLM

🤖 ИИ навыки

Benchmarking
Computer Use Agents
Curriculum Learning
distillation
DPO
JAX
LLM
LoRA
Metrics Development
PPO
Python
PyTorch
QLoRA
quantization
RAG
Reinforcement Learning
RLAIF
RLHF
SFT
Synthetic Data Pipelines
VLM

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Agent Systems
AI
Computer Vision
ML
Model Optimization
NLP
Reinforcement Learning
Research

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации