#вакансия #fulltime #remote #dataengineer #datasupport #etl #bigdata
Компания Centicore находится в поисках Инженера сопровождения дата-продуктов / Data Support Engineer на проекты крупного банка. Наша компания занимается продуктовой разработкой проектов наших Заказчиков под ключ.
Вакансия: Инженер сопровождения дата-продуктов / Data Support Engineer
Формат работы: Удаленно по РФ
Вилка: 300-330к на руки (в зависимости от опыта и пожеланий кандидата)
Технический уровень: Middle / Middle+
Команда занимается задачами сопровождения дата продуктов.
🔷Технические требования:
ЯП: SQL, Python
Технологический стек: Apache Spark, Hadoop\S3\S3-like, Apache Airflow, Parquet\ORC. Знание Apache Iceberg будет плюсом
Навыки работы с: Jira + Confluence или аналогичное, Git, CI/CD, XML, JSON
Навыки системного анализа, тестирования
Базовое знание работы с РСУБД, Kafka
Важно:
- SQL , Spark, Hadoop, Airflow/oozie, понимание ETL , Airflow/oozie, , умение читать код (чтобы понимать как данные из одного места транслируются в другое)
🔷 Задачи:
Сопровождать и анализировать существующие процессы загрузки данных;
Разбирать технические контроли качества данных;
Тестировать доработки и устанавливать их в продуктивный контур;
Анализировать логику ETL-процессов и движение данных между системами;
Взаимодействовать с внутренними командами по вопросам качества и стабильности дата-продуктов;
Поддерживать корректную работу процессов загрузки и обработки данных.
——
⚠️ Безопасность соискателя! Участились случаи целевого HR-скама (блокировка личных MacBook, кража персональных данных, и т.д.). Если работодатель требует авторизоваться в чужом Apple ID, установить MDM-профиль или внести страховой взнос — немедленно прервите контакт, и сообщите администрации нашего канала (контакты есть в информации о канале @datasciencejobs).
🔗 Перед откликом обязательно изучите Регламент безопасности канала.
——
💌 Контакт: для вопросов и резюме — в лс @ktvsk_d
[Ссылка: https://telegra.ph/VNIMANIYU-SOISKATELEJ-REGLAMENT-INFORMACIONNOJ-I-FINANSOVOJ-BEZOPASNOSTI-05-18]
Навыки
Apache Airflow
Apache Iceberg
CI/CD
Hadoop
ICT project management methodologies
JSON
ORC
Parquet
Python (computer programming)
S3
Spark
SQL
tools for software configuration management
use online tools to collaborate
Web Services
Домены
Big Data
ETL
ИИ навыки
Amazon S3
Apache Airflow
Apache Iceberg
CI/CD
data extraction, transformation and loading tools
Hadoop
ICT project management methodologies
JSON
Kafka
operate relational database management system
ORC
Parquet
Python (computer programming)
Spark
ИИ домены
Banking
Big Data
Data Engineering
* Домены определены автоматически с помощью нейросети