Працював в 4 компаніях   6 років 4 місяці

Медицина та Охорона здоров'я, Промисловість та Виробництво, Недержавні організації / NGO

Data Engineer

CMYK Ingredients

Медицина та Охорона здоров'я

2 роки 2 місяці

12.2023 - до теперішнього часу

  • Імплементував оптимізований за витратами наскрізний конвеєр даних, що обробляє понад 500 ГБ щодня та зменшує затримку на 55%
  • Розробив систему виявлення шахрайства в реальному часі з Kafka Streams, обробляючи понад 1 млн подій на день
  • Впровадив систему контролю якості даних з dbt/Great Expectations, виявляючи 95% аномалій

Data analyst

Volac International Ltd

Промисловість та Виробництво

9 місяців

04.2023 - 12.2023

  • Розробив SQL/dbt ETL конвеєр для аналізу виробництва, скоротивши час генерації звітів на 30%
  • Впровадив систему моніторингу якості даних, зменшивши кількість інцидентів з даними на 40%
  • Провів статистичний аналіз для виявлення ризикованих джерел, підвищивши безпеку та якість продукції

Data Engineer

Sprout Dynamics

Медицина та Охорона здоров'я

2 роки

05.2021 - 04.2023

  • Впровадив сховище на Snowflake з обробкою понад 500 ГБ даних щодня з оптимізованим зберіганням
  • Створив систему моніторингу в реальному часі з використанням Kafka/Spark Streaming, обробляючи 100+ подій/сек з доступністю 99.9%
  • Перевів обробку даних з пакетної на потокову, зменшивши затримку з 24 год до <2 хв
  • Наставляв 2 молодших інженерів даних з оптимізації запитів, тестування конвеєрів та найкращих практик моделювання даних

Computational Biology Intern

Helmholtz Research

Недержавні організації / NGO

1 рік 8 місяців

10.2019 - 05.2021

  • Створив конвеєр генної інформації на R/Python для обробки даних біомаркерів у розподілених кластерах та системах
  • Зіставив понад 2000 факторів росту раку, зробивши внесок у дослідження персоналізованої хіміотерапії
  • Виявив та виправив модель даних для клінічного випробування, покращивши точність апроксимації кривої на 60%

Ключова інформація

  • Core: Spark, Kafka, Airflow, SQL, Python, dbt
  • Cloud: GCP, AWS, Databricks, Snowflake, Docker, Linux
  • Architecture: Data Mesh, Data Warehousing, Stream Processing, Query Tuning
  • Optimization: Pipeline Testing, Git Workflows, Config Management, Performance Monitoring

Навчався в 2 закладах

Технічний університет Мюнхена

Біомедицина

Мюнхен, Німеччина, 2022

Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Біотехнології та Біотехніки

Київ, 2020

Володіє мовами

Англійська

вільно

Може проходити співбесіду на цій мові

Може проходити співбесіду на цій мові

IELTS

Микита Ігорович

Data Engineer

Київ

28 років

повна зайнятість, неповна зайнятість, проектна робота

Характер роботи: віддалена робота, гібридна

Оновлено 1 рік тому