К вакансиям
Data Engineer

Big Data Engineer ETL Remote

ID: 17204
28 ноября 2025 г.
Активна
Task agency
Россия
300 000 ₽ - 450 000 ₽

Тип занятости

Полная занятость

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

🛰 Big Data / ETL Engineer в продукт про ончейн-аналитику Компания: Task Agency Локация: remote, кандидаты кроме Беларуси Ищем Big Data / ETL Engineer в продуктовую команду, которая делает деньги из блокчейна. Без хайпа — только код, структура и цифры. 💰 Вилка: 300 000 – 450 000 ₽ net Full-time, формат — удалёнка, децентрализованная команда из разных стран, много асинхрона, созвоны редкие. 🧩 Чем заниматься: - Строить и оптимизировать ETL/ELT-пайплайны для TB+ данных - Работать с ончейн-данными: события блокчейна, calldata, трейсы, Web3 API - Разрабатывать алгоритмы детекции аномалий и метрики производительности - Интегрироваться с потоковыми/сырьевыми данными (Kafka или аналоги) - Развивать инфраструктуру под ресёрч и тест стратегий 🛠 Стек и требования: - Продовый опыт с ClickHouse (шардинг, репликация, партиции, TTL, агрегирующие движки, оптимизация) - Python (pandas/numpy) + создание и поддержка ETL/ELT-пайплайнов - Apache Airflow (DAG, Sensors, Operators, XCom) - Практический опыт алгоритмов отслеживания выбросов: z-score, IQR, Q-test, DBSCAN/HDBSCAN, Isolation Forest и т.п. - Понимание архитектуры данных: схемы, partitioning, latency/throughput, мониторинг, data quality - Контейнеризация, CI/CD, автоматизация деплоя - Опыт работы с бигдатой (ТБ+, миллиарды строк) - Английский от B1 Плюсом будет Rust, Kafka/Prefect/Arrow/Parquet, опыт с ончейн- или трейдинг-данными, pet-проекты в data-инженерии. 💌 Как откликнуться Пиши в ЛС @ne1ubov : - резюме, ссылка на LinkedIn - кратко по опыту с ClickHouse + Airflow - пометка «ETL / Big Data»

🌐 Языки

английский (B1 — Средний)

🛠 Навыки

analyse data
big data technologies
continuous integration and continuous delivery (CI/CD)
Data Architecture
database management systems
Data Engineering
Data Pipelines
data quality management
ETL/ELT processes
manage ICT virtualisation environments
Python (computer programming)
software components libraries
streaming data processing
use data mining techniques
use machine learning algorithms
use statistical analysis system

🎯 Домены

Blockchain
Crypto
Web3

🤖 ИИ навыки

Algorithms
analyse big data
analyse pipeline database information
Apache Airflow
automate cloud tasks
ClickHouse
data extraction, transformation and loading tools
data quality assessment
Data Science
Data Warehouse
Jenkins (tools for software configuration management)
manage ICT data architecture
manage ICT virtualisation environments
Python (computer programming)

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Blockchain
Crypto
Data Engineering
Fin-tech
Web3

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации