К вакансиям
Data Engineer

Data Engineer Quality Of Pickup Points On-site

ID: 35282
8 часов назад
Активна
OZON
Россия, Москва

Формат работы

Полный день

📄 Оригинальный текст вакансии

Data Engineer (направление качества пунктов выдачи) #офис Москва Компания: OZON 🔹Вам предстоит: -Построение и поддержка ETL/пайплайнов: -Разработка, оптимизация и мониторинг для гарантированной доставки данных. -Развитие сервисной модели для аналитиков: -Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы. -Повышение надежности и прозрачности: -Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов. 🔹Технологический стек проекта: -Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark). -Аналитические СУБД: ClickHouse, Vertica, Trino Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование). 🔹Мы ожидаем: -Знание SQL (CTE, оконные функции, оптимизация запросов). -Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов). -Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow. -Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git. -Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop). Контакты: https://career.ozon.ru/vacancy/data-engineer-napravlenie-kachestva-punktov-vidachi-130125978 🔥 Подписаться на наши каналы / @best_itjob / @it_rab [Ссылка: https://t.me/addlist/8QASR3uThEI2ZjVi]

🛠 Навыки

Apache Airflow
Apache Spark
Asynchronous programming
ClickHouse
Hadoop
Kafka
manage ICT virtualisation environments
Python (computer programming)
SQL
tools for software configuration management
Trino
Vertica

🎯 Домены

E-commerce
Logistics

🤖 ИИ навыки

analyse pipeline database information
Apache Airflow
Apache Spark
change power distribution systems
ClickHouse
data extraction, transformation and loading tools
digital data processing
Hadoop
HDFS
Hive
Kafka
manage ICT virtualisation environments
PySpark
Python (computer programming)
SQL
tools for software configuration management
Trino
use query languages
Vertica

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Big Data
Data Analytics
Data Engineering
Data Quality
E-commerce

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)

Канал:devs_it