Data Scientist
Data Scientist Senior NLP LLM Remote
ID: 23580
10 часов назад
Активна
AL Поиск 3.0
Россия
Тип занятости
Полная занятость
Требуемый опыт
Более 6 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
#вакансия #фуллтайм #vacancy
Senior Data Scientist (NLP/LLM)
Локация: Удаленно из РФ или офис (Москва, Санкт-Петербург, Новосибирск);
Компания: AL Поиск 3.0
ЗП:обсуждается,
соцпакет.
Занятость: Полная, full-time.
Обязанности:
Стек проекта: Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost); Hadoop (PySpark, Hive, Kafka); Airflow; Grafana; FineBI.
NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python;
Решение задач машинного обучения и написания кода для нагруженных сервисов на Python;
Развитие текстовой строки новых AI механик. Одна из целей команды - под ключ закрыть потребность общаться с человеком;
Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM.
Требования:
NLP от 5 лет;
Python: читаемый и поддерживаемый код;
SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов;
Apache стек: HDFS/Kafka/Spark (DF API);
Разработка NLP моделей: от tfidf до llm ( работа с pytorch, transformers);
Опыт в DL: обучение/дообучение собственных глубоких нейросетей;
Классический ML: бустинги, линейные модели;
Базовые знания CV: классификация, детекция, сегментация;
Самостоятельное коммуницирование с заказчиками и смежниками.
Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
Условия:
Удаленка из России или офис (Москва, Санкт-Петербург, Новосибирск);
ДМС с первых дней работы (стоматология, госпитализация, полис ВЗР);
Ежегодная компенсация спорта;
5 day off в год помимо основного отпуска;
Доплата за 10 дней больничного;
Скидочные программы от PrimeZone и BestBenefits.
Резюме отправлять @fr_rec
🛠 Навыки
database management systems
Hadoop
Python (computer programming)
software components libraries
Spark
SQL
🎯 Домены
AI
LLM
NLP
🤖 ИИ навыки
database management systems
Deep Learning
Hadoop
Machine Learning
MarkLogic
Natural language processing
Python (computer programming)
software components libraries
Spark
SQL
tuning techniques
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Artificial Intelligence
Big data analytics
Data Science
Machine Learning
Natural Language Processing
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:Machinelearning_Jobs