К вакансиям
Data Engineer

Data Engineer Middle+ Remote

13 часов назад
Активна
Россия
270 000 ₽ - 320 000 ₽

Требуемый опыт

От 3 до 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#vacancy #Fulltime #remote #ITРабота #РаботаВИИ #ITВакансии #УдалённаяРабота #DataEngineer #ML #LLM #AI #Телеком #Вакансия #DWH #RAG 🚀 Вакансия: Data Engineer (LLM) 📍 Проект: Телеком ИИ 🛠 Грейд: Middle+ 💰 Зарплата: от 270 до 320К рублей 📄Оформление: только ИП 🎯Локация/гражданство: РФ Мы ищем опытного Data Engineer для участия в проекте, связанном с искусственным интеллектом и машинным обучением в телекоммуникационной сфере. Что предстоит делать: Подключаться к источникам данных (ERP, CRM, биллинги, лог-шины, API) и консолидировать их. Строить и поддерживать надёжные конвейеры данных (батч/стриминг) с использованием Airflow. Готовить датасеты и фичи для ML/LLM-моделей, включая работу с векторными базами данных и RAG. Проектировать и оптимизировать системы хранения данных (DWH, даталейк, лейкхаус). Настраивать тесты качества данных (валидации, профили, контракты). Интегрировать данные в ML/LLM-пайплайны для обучения и сервинга моделей. Что мы ждём от кандидата: 3+ года опыта в data-инженерии. Уверенное владение SQL (аналитические запросы, оконные функции, оптимизация) и Python. Опыт работы с Airflow (DAG, сенсоры, SLA, retries). Понимание ML-пайплайнов и подготовки данных для обучения моделей. Знание принципов безопасности данных. Опыт работы с S3-совместимыми стораджами и проектированием слоёв данных. Что мы предлагаем: Интересные задачи в перспективной области ИИ и телекоммуникаций. Возможность работать с современными технологиями и инструментами. Удаленная работа! 📩 Как откликнуться: Отправляйте своё резюме @AllaDemHR

🛠 Навыки

Amazon S3
Apache Airflow
Data Warehouse
Large language models
Machine Learning
Python (computer programming)
retrieval-augmented generation
SQL

🎯 Домены

AI
Телеком

🤖 ИИ навыки

Apache Airflow
Batch Processing
Data Integration
Data Lake
Data Modeling
Data Pipeline
Data Quality Assurance
data security
data storage
Data Validation
Data Warehouse
ETL
Large language models
Machine Learning
Python (computer programming)
SQL
Stream Processing
Vector database

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Data Engineering
LLM Applications
Machine Learning
Telecommunications

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)