Data Scientist
Data Scientist NLP Middle/Senior Remote
1 ноября 2025 г.
Активна
Россия
Требуемый опыт
От 3 до 6 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
#работа #вакансия #удалёнка
Data Scientist в NLP Core.
Компания рассматривает кандидатов только из России.
З/п: обсуждается , соцпакет.
Формат работы: Офис, Удаленка, Гибрид(Москва, Санкт-Петербург, Новосибирск);
Уровень позиции: Middle, Senior
🔷Задачи:
Добыча данных – умные системы для поиска товаров, контактов, описаний и других данных, связанных с компаниями;
Поддержка актуальности информации о компаниях – с помощью данных и моделей проводим валидацию существующей информации о компаниях, добываем новую;
Категоризация товаров – автоматическая классификация товаров на основе их описаний и характеристик;
Модерация данных – предотвращаем публикацию нежелательных отзывов и товаров в продукте.
🔷Обязательные требования:
Опыт работы с NLP-задачами 3+ лет;
Уверенное владение PyTorch, HF Transformers и основными библиотеками для обработки текста и ML/DL;
Глубокое понимание LLM: архитектуры моделей, файнтюнинга, техник улучшения качества генерации;
Опыт применения LLM стека: низкоуровневых решений на vLLM, sglang; инструментов для оркустрации и интеграции LangChain, LlamaIndex;
Навыки применения классических, глубоких и LLM моделей;
Уверенные навыки разработки на Python и владение Git;
Готовность работать на всех этапах разработки: от анализа проблемы и проведения экспериментов до оценки решений и их реализации в виде сервисов.
Опыт работы с CI/CD и инфраструктурой: Docker, Gitlab, Kubernetes, Kafka, FastAPI, GRPC;
Глубокое знание Python: multiprocessing, asyncio;
Навыки интеграции и деплоя ML-моделей в продуктовые серверные приложения;
Навыки оптимизации инференса ML/DL-моделей: distillation, pruning, ORT, Triton.
Отклики ждём с пометкой 'nlp core' @fr_rec
🛠 Навыки
AsyncIO
CI/CD
DL
Docker
FastAPI
Git
GitLab
gRPC
HF Transformers
Kafka
Kubernetes
LangChain
LlamaIndex
LLM
ML
multiprocessing
Python
PyTorch
SGLang
vLLM
🎯 Домены
NLP
🤖 ИИ навыки
AsyncIO
CI/CD
distillation
Docker
FastAPI
Git
GitLab
gRPC
HF Transformers
Inference Optimization
Kafka
Kubernetes
LangChain
LlamaIndex
ML model deployment
multiprocessing
ORT
Pruning
Python
PyTorch
SGLang
Triton
vLLM
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Content Moderation
Data Mining
Data Science
Data Validation
Deep Learning
LLM
Machine Learning
NLP
Text Classification
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:Machinelearning_Jobs