Работал в 4 компаниях   6 лет 4 месяца

Медицина и Здравоохранение, Промышленность и Производство, Негосударственные организации / NGO

Data Engineer

CMYK Ingredients

Медицина и Здравоохранение

2 года 2 месяца

12.2023 - по настоящее время

  • Імплементував оптимізований за витратами наскрізний конвеєр даних, що обробляє понад 500 ГБ щодня та зменшує затримку на 55%
  • Розробив систему виявлення шахрайства в реальному часі з Kafka Streams, обробляючи понад 1 млн подій на день
  • Впровадив систему контролю якості даних з dbt/Great Expectations, виявляючи 95% аномалій

Data analyst

Volac International Ltd

Промышленность и Производство

9 месяцев

04.2023 - 12.2023

  • Розробив SQL/dbt ETL конвеєр для аналізу виробництва, скоротивши час генерації звітів на 30%
  • Впровадив систему моніторингу якості даних, зменшивши кількість інцидентів з даними на 40%
  • Провів статистичний аналіз для виявлення ризикованих джерел, підвищивши безпеку та якість продукції

Data Engineer

Sprout Dynamics

Медицина и Здравоохранение

2 года

05.2021 - 04.2023

  • Впровадив сховище на Snowflake з обробкою понад 500 ГБ даних щодня з оптимізованим зберіганням
  • Створив систему моніторингу в реальному часі з використанням Kafka/Spark Streaming, обробляючи 100+ подій/сек з доступністю 99.9%
  • Перевів обробку даних з пакетної на потокову, зменшивши затримку з 24 год до <2 хв
  • Наставляв 2 молодших інженерів даних з оптимізації запитів, тестування конвеєрів та найкращих практик моделювання даних

Computational Biology Intern

Helmholtz Research

Негосударственные организации / NGO

1 год 8 месяцев

10.2019 - 05.2021

  • Створив конвеєр генної інформації на R/Python для обробки даних біомаркерів у розподілених кластерах та системах
  • Зіставив понад 2000 факторів росту раку, зробивши внесок у дослідження персоналізованої хіміотерапії
  • Виявив та виправив модель даних для клінічного випробування, покращивши точність апроксимації кривої на 60%

Ключевая информация

  • Core: Spark, Kafka, Airflow, SQL, Python, dbt
  • Cloud: GCP, AWS, Databricks, Snowflake, Docker, Linux
  • Architecture: Data Mesh, Data Warehousing, Stream Processing, Query Tuning
  • Optimization: Pipeline Testing, Git Workflows, Config Management, Performance Monitoring

Учился в 2 заведениях

Технічний університет Мюнхена

Біомедицина

Мюнхен, Німеччина, 2022

Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Біотехнології та Біотехніки

Київ, 2020

Владеет языками

Английский

свободно

Может проходить собеседование на этом языке

Может проходить собеседование на этом языке

IELTS

Микита Ігорович

Data Engineer

Киев

28 лет

полная занятость, неполная занятость, проектная работа

Характер работы: удаленная работа, гибридная

Обновлено 1 год назад