ML Engineer

AI Engineer Senior Remote

3 дня назад

Активна

4 000 $ - 6 000 $

Формат работы

Удаленная работа

📞Способы связи

@foreverinlovewithsummertelegram

📄 Оригинальный текст вакансии

#vacancy #job #AI #remote #senior #cua #AI_engineer #LLM #VLM #researcher Senior Computer Use AI Agents Engineer (remote) Compensation: $4,000–6,000/month (depending on experience) Задачи: ● Разработка и улучшение Computer Use (CUA) агентов: perception, reasoning, planning, action execution. ● Проектирование и обучение LLM/VLM моделей: от дообучения до обучения с нуля (если требуется). ● Построение и поддержка бенчмарков, автотестов и метрик качества для CUI-агентов. ● Разработка пайплайнов, datasets, симуляторов и инструментов для безопасного обучения агентов. ● Оптимизация inference, настройка LoRA/QLoRA, distillation, адаптации под on-premise и ограниченные GPU. ● Работа с RAG, memory, tool-use, multi-agent pipelines. ● Участие в R&D экспериментах, fast-iteration режиме по запуску новых фич. Требования: Обязательные: ● Сильный инженерный/исследовательский бэкграунд, идеальный вариант — выпускник топ-университета (Stanford, MIT, Berkeley, ETH, CMU или MIPT). ● Опыт работы в командах крупных AI-игроков (FAANG, OpenAI, Anthropic, DeepMind, xAI, NVIDIA, HuggingFace — или аналогичные масштабные проекты). ● Глубокий опыт в обучении и дообучении LLM и VLM моделей (PyTorch, JAX). ● Практический опыт разработки COMPUTER USE агентов ● Опыт в построении бенчмарков, метрик и системной оценки моделей. Будет плюсом: ● Опыт применения Reinforcement Learning (RLHF/RLAIF, PPO, DPO, curriculum learning). ● Знание LoRA/QLoRA, quantization, SFT, distillation. ● Публикации по ML/AI (NeurIPS, ICML, ICLR, CVPR, ACL и др). ● Опыт работы с большими датасетами, synthetic data pipelines. Контакт для связи в телеграм: @foreverinlovewithsummer

🛠 Навыки

distillation

DPO

JAX

LoRA

PPO

PyTorch

QLoRA

quantization

RAG

SFT

🎯 Домены

Computer Use Agents

LLM

Reinforcement Learning

Research

VLM

🤖 ИИ навыки

Benchmarking

Computer Use Agents

Curriculum Learning

distillation

DPO

JAX

LLM

LoRA

Metrics Development

PPO

Python

PyTorch

QLoRA

quantization

RAG

Reinforcement Learning

RLAIF

RLHF

SFT

Synthetic Data Pipelines

VLM

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Agent Systems

Computer Vision

Model Optimization

NLP

Reinforcement Learning

Research

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (2)

https://t.me/python_django_work/121188

https://t.me/Machinelearning_Jobs/120298

Канал:Machinelearning_Jobs