Data Engineer
ETL Developer Data Engineer Remote
ID: 23536
5 часов назад
Активна
Greenlabs
Россия
от 300 000 ₽
Требуемый опыт
От 3 до 6 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
❗️В аккредитованную ИТ-компанию Greenlabs требуется ETL-разработчик / Data Engineer ❗️
🤝Оформление: ТК РФ, ИП, ГПХ - любой вариант
З/П: 300 000 рублей gross
Формат: удалённо
Компетенции:
- Хороший опыт разработки ETL-процессов с использование инструментов SAS (от трех лет;
- Опыт разработки ETL-процессов для Greenplum;
- Опыт участия в проектах по созданию и развитию DWH;
- Умение работать с Bash-скриптами;
- Опыт промышленной разработки на Python;
Опыт участия в проектах по созданию и развитию Data Vault.
Задачи:
- Разработка архитектуры системы копирования данных;
- Разработка архитектуры системы трансформации данных;
- Настройка тестовой центральной ETL среды и тестовой MPP Greenplum;
- Модуль управления (добавления) заданиями;
- Разработка переноса таблиц staging в конечные таблицы хранилища;
- Процесс создания view и плоских таблиц на основе мета данных для интеграции другими системами;
- Реализация ETL-процесса c копированием таблиц SAS;
- Оптимизация производительности;
- Проведение нагрузочного тестирования;
- Адаптация разработанного функционала для переноса на продуктивный стенд;
- Продуктивизация сборки витрин и создание интеграций с источниками по разработанным концепциям архитектуры.
Технологии: Oracle/Hadoop/Teradata, SQL/Python/Spark/Hive, Airflow, Grafana/ SAS
Контакты:
- @sdobrynin
- @serdobrynin
- +79198550755
🛠 Навыки
Apache Airflow
Apache Hive
computer programming
Data Warehouse
Grafana
Greenplum
Hadoop
Oracle Relational Database
Python (computer programming)
SAS language
Spark
SQL
Teradata Database
🤖 ИИ навыки
Apache Airflow
Apache Hive
Apache Spark
data extraction, transformation and loading tools
Data Warehouse
ETL development
Grafana
Hadoop
ICT system programming
maintain database performance
Oracle Relational Database
process data
Python (computer programming)
SAS language
SQL
statistical modeling techniques
System Design
Teradata Database
test soil load bearing capacity
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Business Intelligence
Database Management
Data Processing
Information technology
Software Development
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:Machinelearning_Jobs