Пошук роботи на robota.uaukraine
Віддалена робота

Senior Bioinformatics Engineer

UKEESS Software House
11 годин тому
24 вересня 2024
Львів
Віддалена робота
Гібридна
Повна зайнятість
Медичне страхування
Компенсація спортзалу
Курси іноземної мови
Компенсація навчання
Безкоштовне навчання

UKEESS Software House шукає Senior Bioinformatics Engineer на повний робочий день (або в офісі у Львові, або з можливістю віддаленої співпраці в Україні).

Про замовника:

Це один з найбільших у світі ресурсів по сімейній історії та ДНК. За допомогою цього сервісу і ДНК-аналізу, наприклад, можна визначити етнічне походження, схильність до алергій, різноманітних хвороб, особливості тілобудови тощо (зараз - це близько 100 предикшинів в плані днк-аналізу). Також можна побудувати своє сімейне дерево на базі у понад 30 млрд оцифрованих архівних (у США) записів від XVIII ст. (+ ця цифра постійно росте) і дізнатись цікаві факти про своїх предків. Загалом, наш замовник вважається найбільшим у своєму спейсі. :)

Про проект та команду:

Ви приєднаєтесь до команди Data Science Engineering, яка працює над проектами, що пов'язані з дослідженням ДНК.  Один із наших проектів — прогнозування рис людей за допомогою SNP.

На цій посаді ви працюватимете із інфраструктурою та дослідницькою діяльністю, наприклад налаштуванням EMR, менедження Data Lake, роботою з хмарним середовищем, автоматизацією робочого процесу, розробкою даних та аналітикою. 

Технічний стек проекту: Python 3.8-3.11 / Django / MySQL / Nextflow / Airflow / PySpark / Docker / AWS (IAM, S3, EC2, FSx for Lustre) / Kubernetes 

Обов'язки нашого майбутнього колеги:

  • Проектування та розробка складних великомасштабних систем, які щодня обробляють мільярди історичних записів

  • Розробка ETL-пайплайнів із використанням Spark і Airflow

  • Проектування та імплементація Nextflow-пайплайнів для обробки SNPs

  • Робота з data engineering/processing/analytic

  • Робота з хмарним середовищем (сервіси AWS)

  • Визначення можливості впровадження інноваційних технологій

  • Написання коду та юніт-тестів

  • Постіний код-рев'ю пул-реквестів

  • Діагностика складних проблем із залученням кількох систем і технологій

Наш ідеальний кандидат - це інженер із:

  • хорошими навичками володіння Python

  • здатністю обчислювати підсумкову статистику для вибірок даних

  • критичними мисленням та відкритий до нових знань і навиків.

Необхідний досвід і навички:

  • Хороші знання або досвід роботи із інструментами для Біоінформатики та базами даних: DBs: BLAST, GATK, NCBI, UCSC Genome browser, тощо

  • 5+ років комерційного досвіду роботи із Python

  • Комерційний досвід роботи з реляційними базами даних (MySQL бажано)

  • Комерційний досвід роботи з інструментами оркестрації (Airflow / Nextflow бажано)

  • Досвід із AWS (S3, EC2)

  • Досвід роботи з CI/CD

  • Англійська: вище середнього щонайменше (розмовна та письмова)

Буде перевагою:

  • Хороші знання або досвід із PySpark

  • Хороші знання або досвід із Django або Flask

  • Хороші знання або досвід із Rust

  • Хороші знання або досвід із Java

  • Досвід із Docker і Kubernetes

  • Знання або досвід із Scikit-learn

  • Досвід із AWS FSx for Lustre і SageMaker 

  • Знання або досвід із ML

  • Комерційний досвід роботи з Airflow та/або Kubernetes

Що ми пропонуємо новому колезі?

  • Конкурентоспроможна компенсація (на основі ринкових даних, але також залежить від технічного рівня кандидата)

  • Гнучкий графік роботи

  • Щорічна оплачувана відпустка

  • Безкоштовні уроки англійської (онлайн)

  • Медичне страхування або дві альтернативи на вибір

  • Індивідуальний плани для професійного та особистісного розвитку

  • Відсутність бюрократії та мікро менеджменту

  • Сучасний комфортний офіс (зона барбекю, кухні, кімнати відпочинку та ін.)

  • Закордонні відрядження (після війни)

  • Парковка на території та зарядна станція для електромобілів

  • Корпоративні подарунки, свята та розваги

  • Спортивні активності: настільний теніс, футбол, воркаут

Надішліть нам своє резюме і давайте познайомимося! ;)

----------------------------------------------------------------------------------------------------------------

Team of UKEESS Software House is currently looking for a Senior Bioinformatics Engineer to join our team for a full-time position (remotely in Ukraine or in Lviv’s office).

About the Customer:

Our customer is the world’s largest DNA network from the USA. With more than 30 billion digitized global historical records, 130 million family trees, and 18+ million people in their growing database, our customers help people discover their family stories and gain actionable insights about their health and wellness. 

About the Project and Team:

You will join the Data Science Engineering team and work on DNA research projects. One of our projects is a prediction of people’s traits using SNPs.

As a part of the team, you will work on infrastructure and research activities, such as setting up EMR, Data Lake management/governance, cloud-environment activities, workflow automation, data engineering, and analytics. 

Technologies stack: Python 3.8-3.11 / Django / MySQL / Nextflow / Airflow / PySpark / Docker / AWS (IAM, S3, EC2, FSx for Lustre) / Kubernetes 

Responsibilities will include:

  • Help architect, design, and develop complex, large-scale systems that process billions of records every day

  • Development of ETL pipeline using Spark and Airflow

  • Design and implement a Nextflow pipeline to process SNPs

  • Working with data processing/engineering/analytics

  • Working with cloud-environment (AWS services)

  • Identify opportunities to adopt innovative technologies and automation workflow

  • Write code and unit tests

  • Conduct code reviews

  • Diagnose complex problems involving multiple systems and technologies

  • Be an example of engineering excellence

Our ideal candidate will have good Python skills, the right mixture of critical thinking, a can-do attitude, solid programming fundamentals, an understanding of time series data, and the ability to calculate summary statistics for data samples.

Requirements:

  • Knowledge or experience with Bioinformatics tools & DBs: BLAST, GATK, NCBI, UCSC Genome browser, etc.

  • 5+ years of commercial experience with Python 

  • Commercial experience with relational databases (MySQL is preferable) 

  • Commercial experience with orchestration tools (Airflow / Nextflow is preferable)

  • Experience with AWS (S3, EC2)

  • Experience with CI/CD

  • English: Upper-intermediate at least (both spoken and written)

It will be a plus:

  • Strong knowledge or commercial experience with PySpark

  • Strong knowledge or commercial experience with Django or Flask

  • Strong knowledge or commercial experience with Rust 

  • Experience with Docker and Kubernetes

  • Knowledge or commercial experience with Scikit-learn

  • Experience with AWS FSx for Lustre and SageMaker 

  • Strong knowledge or commercial experience with Java

  • Knowledge or experience with ML

What do we offer our new colleague?

  • Competitive compensation (based on market data but also depending on the technical level of the candidate)

  • Flexible work schedule

  • 3 health packages to choose

  • Annual paid vacation and state holiday celebration

  • Free English classes (online)

  • Individual approach to professional growth

  • Lack of bureaucracy and micromanagement

  • Modern, comfortable office facilities (a barbecue zone, kitchens, lounge rooms, coffee machines, etc.)

  • Foreign business trips

  • On-site parking lot and charge station for Electric Cars

  • Corporate gifts, celebrations, and fun activities

  • Sports activities: ping-pong, soccer, work-out

If you have a passion for solving challenging problems; building scalable, robust systems; love working with the latest technologies in a fast-paced, flexible environment; and are excited at the prospect of having a significant impact on products which has more than 3 million paying subscribers, then we want to talk to you! ;-)

Відділ персоналу

Схожі вакансії

Схожі вакансії за професіями: