ML Engineer
LLM Engineer Senior Remote
27 октября 2025 г.
Активна
HighSky
8 000 $ - 15 000 $
Требуемый опыт
Более 6 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
Вакансия: Senior LLM-Engineer
Компания: HighSky
Вилка: 8000$ - 15000$
Мы - динамично развивающийся стартап, решающий различные задачи AI в соревновательном формате: генерация текста, аудио и видео, обогащение данных, предиктивная аналитика. Мы осуществляем полный цикл работы над продуктом: от анализа бизнес-задачи до вывода в продакшен полноценного решения
Находимся в поиске эксперта по обучению LLM
Чем предстоит заниматься:
Главная задача: обучить 1го LLM-агента для решения разных задач (instruction tuning):
math solving
sql generation
programming
Подзадачи:
fine-tuning LLM: Cross-domain generalization, Trajectory fine-tuning, Behavior Cloning
эксперименты с различными способами обучения: SFT, DPO, PPO, GRPO, RLHF, PEFT, Knowledge distillation
Сбор, очищение данных
Выбор архитектур и pre-trained моделей
Объединение моделей и адаптеров
Требования к кандидату:
• Опыт обучения LLM (fine-tuning / pre-training) от 2 лет
• Опыт применения различных методов обучения LLM
• Опыт с различными pre-trained моделями
• Опыт работы с экосистемой huggingface: transformers, datasets, peft, trl
• Хорошее понимание теоретической базы: NLP, transformers, LLM.
• Понимание всех циклов предобучения и файнтюнинга
RL, classic ML
• Опыт коммерческой разработки с нуля
• Опыт работы от 6 лет
• Высшее образование в области компьютерных технологий / прикладной математики и (или) прикладной информатики;
Будет плюсом:
• Научные исследования по Computer Science
• Призовые места в соревнованиях (kaggle, boosters), опыт участия в хакатонах
• ШАД / Школа 21
Что мы предлагаем:
• Участие в разработке динамично развивающегося продукта, работающего на рынке в реальном времени;
• Справедливую заработную плату по результатам собеседования и вашей квалификации в вилке 8.000$-15.000$;
• Возможность прокачивать свою экспертизу за счет работы с топовыми коллегами и обучения в моменте;
• Классный молодой коллектив профессионалов, заряженных на результат.
• Ценим порядочность, честность и открытость;
• Возможность реализовывать смелые и амбициозные инициативы;
• Горизонтальную структуру, отсутствие бюрократии и синдромов «больших начальников»;
• Мы за результат, а не процесс. У всех наших сотрудников удобный график и полностью удаленная работа.
Если увидел в этом описании себя - скорее откликайся, чтобы стать частью нашей команды!
Контакт: @dybovanya
🛠 Навыки
Adapters
Behavior Cloning
Cross-domain generalization
Data Cleaning
Datasets
DPO
Fine-tuning
GRPO
HuggingFace
Knowledge distillation
LLM
Model architecture selection
NLP
PEFT
PPO
Pre-trained models
Pre-training
RLHF
SFT
Trajectory fine-tuning
Transformers
T rl
🎯 Домены
AI
Audio Generation
Data Enrichment
Predictive Analytics
Text Generation
Video Generation
🤖 ИИ навыки
Adapter Integration
Behavior Cloning
Classic ML
Cross-domain generalization
Data Cleaning
DPO
Fine-tuning
GRPO
Hugging Face
Knowledge distillation
LLM
Model architecture selection
NLP
PEFT
PPO
Pre-training
Reinforcement Learning
RLHF
SFT
Trajectory fine-tuning
Transformers
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
AI
Applied mathematics
Computer Science
Data Science
ML
NLP
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:datascienceml_jobs