К вакансиям
Data Scientist

Data Scientist NLP Middle/Senior Remote

1 ноября 2025 г.
Активна
Россия

Требуемый опыт

От 3 до 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#работа #вакансия #удалёнка Data Scientist в NLP Core. Компания рассматривает кандидатов только из России. З/п: обсуждается , соцпакет. Формат работы: Офис, Удаленка, Гибрид(Москва, Санкт-Петербург, Новосибирск); Уровень позиции: Middle, Senior 🔷Задачи: Добыча данных – умные системы для поиска товаров, контактов, описаний и других данных, связанных с компаниями; Поддержка актуальности информации о компаниях – с помощью данных и моделей проводим валидацию существующей информации о компаниях, добываем новую; Категоризация товаров – автоматическая классификация товаров на основе их описаний и характеристик; Модерация данных – предотвращаем публикацию нежелательных отзывов и товаров в продукте. 🔷Обязательные требования: Опыт работы с NLP-задачами 3+ лет; Уверенное владение PyTorch, HF Transformers и основными библиотеками для обработки текста и ML/DL; Глубокое понимание LLM: архитектуры моделей, файнтюнинга, техник улучшения качества генерации; Опыт применения LLM стека: низкоуровневых решений на vLLM, sglang; инструментов для оркустрации и интеграции LangChain, LlamaIndex; Навыки применения классических, глубоких и LLM моделей; Уверенные навыки разработки на Python и владение Git; Готовность работать на всех этапах разработки: от анализа проблемы и проведения экспериментов до оценки решений и их реализации в виде сервисов. Опыт работы с CI/CD и инфраструктурой: Docker, Gitlab, Kubernetes, Kafka, FastAPI, GRPC; Глубокое знание Python: multiprocessing, asyncio; Навыки интеграции и деплоя ML-моделей в продуктовые серверные приложения; Навыки оптимизации инференса ML/DL-моделей: distillation, pruning, ORT, Triton. Отклики ждём с пометкой 'nlp core' @fr_rec

🛠 Навыки

AsyncIO
CI/CD
DL
Docker
FastAPI
Git
GitLab
gRPC
HF Transformers
Kafka
Kubernetes
LangChain
LlamaIndex
LLM
ML
multiprocessing
Python
PyTorch
SGLang
vLLM

🎯 Домены

NLP

🤖 ИИ навыки

AsyncIO
CI/CD
distillation
Docker
FastAPI
Git
GitLab
gRPC
HF Transformers
Inference Optimization
Kafka
Kubernetes
LangChain
LlamaIndex
ML model deployment
multiprocessing
ORT
Pruning
Python
PyTorch
SGLang
Triton
vLLM

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Content Moderation
Data Mining
Data Science
Data Validation
Deep Learning
LLM
Machine Learning
NLP
Text Classification

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)