🖥 Senior Data Scientist
Удалёнка/Гибрид (Москва)
Ecom.tech — ИТ-решения для ритеила реального времени
Требования:
– Опыт от 3 лет в задачах ранжирования, поиска или рекомендательных систем в продакшене.
– Опыт обучения LTR-моделей на градиентном бустинге (XGBoost, LightGBM, CatBoost): кастомные функции потерь, работа с признаками под ранжирование, интерпретация моделей.
– Понимание двухуровневой схемы поиска (отбор кандидатов и реранкинг), метрик ранжирования и их компромиссов на разных этапах.
– Понимание типовых проблем ранжирования (смещения в кликовых данных, дрифты, feedback loop) и подходов к их решению.
– Понимание современных нейросетевых подходов в ранжировании (dense retrieval, нейронные реранкеры, sequence-модели) — применимость и компромиссы.
– Продакшен-качество Python-кода: модульность, тесты, читаемость, готовность к передаче MLE на продуктивизацию без переписывания.
– Самостоятельная разработка пайплайнов подготовки данных на PySpark и Polars — нетривиальные трансформации без помощи DA/DE.
– Понимание A/B-тестирования: устройство эксперимента, классы метрик (целевые, прокси, защитные, информационные), формирование набора метрик и ожидаемых эффектов до запуска.
– Умение разбирать ошибки модели, превращать их в продуктовые гипотезы и связывать метрики качества модели с метриками бизнеса и воронкой конверсии.
– Самостоятельность в работе с задачами высокой неопределённости: декомпозиция, оценка сроков, проактивное обсуждение рисков с командой.
➡️ Подробнее о вакансии на hh.ru
📍 Навигация: База знаний • Задачи • Собеседования
[Ссылка: https://hh.ru/vacancy/133768709]
[Ссылка: https://t.me/dsproglib]
[Ссылка: https://t.me/ds_problems_lib]
[Ссылка: https://t.me/ds_interview_lib]