К вакансиям
Data Engineer

Data Engineer Remote

ID: 29549
17 февраля 2026 г.
Активна
AI HealthTech стартап
Россия, Москва
300 000 ₽ - 350 000 ₽

Тип занятости

ГПХ или совместительство

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#вакансия #dataengineer #llm #healthtech #фултайм #москва Вакансия: Data Engineer Компания: AI HealthTech стартап Формат: гибридный (предпочтительно) / удаленный по РФ Оформление: ГПХ (после ИС возможен переход на ТК) Локация: Москва-Сити Занятость: full-time Вилка: 300 - 350к ₽ Гросс AI Healthcare стартап создает продукт, который трансформирует привычные процессы в здравоохранении, делая их эффективнее и меняя мир к лучшему 🕊 Сейчас команда в поиске Data Engineer, который будет заниматься построением и оптимизацией ETL-пайплайнов для обработки миллионов строк медицинских данных. Вам предстоит обеспечивать качество и целостность данных, вы будете работать на стыке клиник, поставщиков данных и ML-команды, обеспечивая стандарты для обучения моделей. 🔸 Основные задачи: · Анализ, нормализация и очистка крупных медицинских датасетов (EHR, анализы, диагнозы). · Разработка и адаптация ETL-пайплайнов под разные источники данных. · Контроль качества входящих данных, коммуникация с поставщиками и стейкхолдерами. · Тесная работа с ML-инженерами над форматами данных и улучшением пайплайнов. 🔸 Что ожидаем: · Опыт работы с Python (Pandas, NumPy, PyTorch; PySpark / Dask - плюс). · Понимание описательной и инференциальной статистики. · Готовность к предобработке данных на основе LLM. · Опыт работы с большими языковыми LLM моделями. · Практика работы с данными масштаба миллионов записей. · Умение ясно доносить идеи как технической, так и нетехнической аудитории. · Готовность погружаться в медицинскую специфику. 🔸 Будет плюсом: · Опыт в биоинформатике / медицине / HealthTech. · Понимание конфиденциальности данных (GDPR / HIPAA). · Знание медицинских систем кодирования (ICD-10, LOINC). · Опыт с ETL-оркестрацией (Airflow), FHIR / HL7. 🔸 Условия: · В компании действительно мощная команда талантливых специалистов, в которой есть несколько PhD, они драйвят процессы и привносят по своему уникальные решения в реализацию продукта. · Возможность применить опыт и развить экспертизу в проекте, который реально помогает людям. · Высокая степень ответственности и влияния на архитектуру данных и конечный продукт. · Работа со сложными задачами и современным стеком технологий. · Оплата в рублях или USDT. Направляйте ваши отклики с резюме - @Inga_IT 📩

🛠 Навыки

Apache Airflow
Dask
FHIR
HL7
NumPy
pandas
PySpark
Python (computer programming)
PyTorch

🎯 Домены

AI
Healthcare
ML

🤖 ИИ навыки

analyse big data
Business process modelling
computational linguistics
database management systems
data extraction, transformation and loading tools
Data Mining
Data Science
Data Warehouse
gather data
GDPR
inspect data
Machine Learning
MarkLogic
medical imaging technology
perform data mining
process data
Python (computer programming)
software components libraries
SQL
statistical analysis system software
Statistics
tools for software configuration management
unified modelling language

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Healthcare
HealthTech
Medical data processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)