К вакансиям
Data Scientist

Data Scientist Senior NLP LLM Remote

ID: 23580
9 часов назад
Активна
AL Поиск 3.0
Россия

Тип занятости

Полная занятость

Требуемый опыт

Более 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#вакансия #фуллтайм #vacancy Senior Data Scientist (NLP/LLM) Локация: Удаленно из РФ или офис (Москва, Санкт-Петербург, Новосибирск); Компания: AL Поиск 3.0 ЗП:обсуждается, соцпакет. Занятость: Полная, full-time.                                                                                          Обязанности: Стек проекта: Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost); Hadoop (PySpark, Hive, Kafka); Airflow; Grafana; FineBI. NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python; Решение задач машинного обучения и написания кода для нагруженных сервисов на Python; Развитие текстовой строки новых AI механик. Одна из целей команды - под ключ закрыть потребность общаться с человеком; Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM. Требования: NLP от 5 лет; Python: читаемый и поддерживаемый код; SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов; Apache стек: HDFS/Kafka/Spark (DF API); Разработка NLP моделей: от tfidf до llm ( работа с pytorch, transformers); Опыт в DL: обучение/дообучение собственных глубоких нейросетей; Классический ML: бустинги, линейные модели; Базовые знания CV: классификация, детекция, сегментация; Самостоятельное коммуницирование с заказчиками и смежниками. Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др. Условия: Удаленка из России или офис (Москва, Санкт-Петербург, Новосибирск); ДМС с первых дней работы (стоматология, госпитализация, полис ВЗР); Ежегодная компенсация спорта; 5 day off в год помимо основного отпуска; Доплата за 10 дней больничного; Скидочные программы от PrimeZone и BestBenefits. Резюме отправлять @fr_rec

🛠 Навыки

database management systems
Hadoop
Python (computer programming)
software components libraries
Spark
SQL

🎯 Домены

AI
LLM
NLP

🤖 ИИ навыки

database management systems
Deep Learning
Hadoop
Machine Learning
MarkLogic
Natural language processing
Python (computer programming)
software components libraries
Spark
SQL
tuning techniques

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Big data analytics
Data Science
Machine Learning
Natural Language Processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)