К вакансиям
ML Engineer

LLM Optimization Specialist

9 часов назад
Активна
DL-школа DeepSchool

Требуемый опыт

От 1 года до 3 лет

📞Способы связи

📄 Оригинальный текст вакансии

Привет! DL-школа DeepSchool ищет спикера на лекцию по оптимизации и ускорению LLM/ Мы повышаем квалификацию действующих DL-инженеров: помогаем освоить новую задачу или хорошие практики. Например, строить SLAM-ы, тюнить LLM, учить Gaussian Splatting или деплоить веб-сервисы. Сейчас ищем эксперта, который погружен в задачи продуктивного деплоя и ускорения инференса больших моделей. Мы ожидаем, что человек имеет большой опыт в DL, а последний год-два занимался оптимизацией LLM для развертывания на серверных мощностях. 🎒 Что делать: — подготовка лекции и домашнего задания — проверка домашних работ 🎒 Что ожидаем: — опыт в DL от 2-х лет — практический опыт оптимизации и деплоя LLM от года — уверенное владение фреймворками для ускорения инференса, такими как vLLM, SGLang, TensorRT-LLM — понимание и опыт применения методов квантования: AWQ, GPTQ (знание AQLM будет плюсом) — знакомство с другими методами сжатия и оптимизации, например Speculative Decoding (Medusa, Eagle-1,2) 🎒 Что предлагаем: — платим за подготовку лекции и домашнее задание — доступ ко всем программам школы: можно ходить на лекции, задавать вопросы и сдавать домашки — ревьюеры помогут сделать лекцию понятнее и добавят свой опыт — редактор поможет с текстами — дизайнер поможет с подготовкой презентации 🤙 Откликнуться или задать вопрос: @t_romakhina

🛠 Навыки

AWQ
Eagle
GPTQ
Medusa
SGLang
Speculative Decoding
TensorRT-LLM
vLLM

🎯 Домены

AI
ML

🤖 ИИ навыки

AQLM
artificial neural networks
AWQ
Deep Learning
Eagle-1
Eagle-2
GPTQ
Inference Optimization
Large language models
Machine Learning
Medusa
Model Deployment
Model Optimization
Python (computer programming)
quantization
server-side deployment
SGLang
Speculative Decoding
TensorRT-LLM
vLLM

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Deep learning education
High-Performance Computing
Machine Learning
Model compression
Natural Language Processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации