UKEESS Software House шукає Senior Bioinformatics Engineer на повний робочий день (або в офісі у Львові, або з можливістю віддаленої співпраці в Україні).
Про замовника:
Це один з найбільших у світі ресурсів по сімейній історії та ДНК. За допомогою цього сервісу і ДНК-аналізу, наприклад, можна визначити етнічне походження, схильність до алергій, різноманітних хвороб, особливості тілобудови тощо (зараз - це близько 100 предикшинів в плані днк-аналізу). Також можна побудувати своє сімейне дерево на базі у понад 30 млрд оцифрованих архівних (у США) записів від XVIII ст. (+ ця цифра постійно росте) і дізнатись цікаві факти про своїх предків. Загалом, наш замовник вважається найбільшим у своєму спейсі. :)
Про проект та команду:
Ви приєднаєтесь до команди Data Science Engineering, яка працює над проектами, що пов'язані з дослідженням ДНК. Один із наших проектів — прогнозування рис людей за допомогою SNP.
На цій посаді ви працюватимете із інфраструктурою та дослідницькою діяльністю, наприклад налаштуванням EMR, менедження Data Lake, роботою з хмарним середовищем, автоматизацією робочого процесу, розробкою даних та аналітикою.
Технічний стек проекту: Python 3.8-3.11 / Django / MySQL / Nextflow / Airflow / PySpark / Docker / AWS (IAM, S3, EC2, FSx for Lustre) / Kubernetes
Обов'язки нашого майбутнього колеги:
Проектування та розробка складних великомасштабних систем, які щодня обробляють мільярди історичних записів
Розробка ETL-пайплайнів із використанням Spark і Airflow
Проектування та імплементація Nextflow-пайплайнів для обробки SNPs
Робота з data engineering/processing/analytic
Робота з хмарним середовищем (сервіси AWS)
Визначення можливості впровадження інноваційних технологій
Написання коду та юніт-тестів
Постіний код-рев'ю пул-реквестів
Діагностика складних проблем із залученням кількох систем і технологій
Наш ідеальний кандидат - це інженер із:
хорошими навичками володіння Python
здатністю обчислювати підсумкову статистику для вибірок даних
критичними мисленням та відкритий до нових знань і навиків.
Необхідний досвід і навички:
Хороші знання або досвід роботи із інструментами для Біоінформатики та базами даних: DBs: BLAST, GATK, NCBI, UCSC Genome browser, тощо
5+ років комерційного досвіду роботи із Python
Комерційний досвід роботи з реляційними базами даних (MySQL бажано)
Комерційний досвід роботи з інструментами оркестрації (Airflow / Nextflow бажано)
Досвід із AWS (S3, EC2)
Досвід роботи з CI/CD
Англійська: вище середнього щонайменше (розмовна та письмова)
Буде перевагою:
Хороші знання або досвід із PySpark
Хороші знання або досвід із Django або Flask
Хороші знання або досвід із Rust
Хороші знання або досвід із Java
Досвід із Docker і Kubernetes
Знання або досвід із Scikit-learn
Досвід із AWS FSx for Lustre і SageMaker
Знання або досвід із ML
Комерційний досвід роботи з Airflow та/або Kubernetes
Що ми пропонуємо новому колезі?
Конкурентоспроможна компенсація (на основі ринкових даних, але також залежить від технічного рівня кандидата)
Гнучкий графік роботи
Щорічна оплачувана відпустка
Безкоштовні уроки англійської (онлайн)
Медичне страхування або дві альтернативи на вибір
Індивідуальний плани для професійного та особистісного розвитку
Відсутність бюрократії та мікро менеджменту
Сучасний комфортний офіс (зона барбекю, кухні, кімнати відпочинку та ін.)
Закордонні відрядження (після війни)
Парковка на території та зарядна станція для електромобілів
Корпоративні подарунки, свята та розваги
Спортивні активності: настільний теніс, футбол, воркаут
Надішліть нам своє резюме і давайте познайомимося! ;)
----------------------------------------------------------------------------------------------------------------
Team of UKEESS Software House is currently looking for a Senior Bioinformatics Engineer to join our team for a full-time position (remotely in Ukraine or in Lviv’s office).
About the Customer:
Our customer is the world’s largest DNA network from the USA. With more than 30 billion digitized global historical records, 130 million family trees, and 18+ million people in their growing database, our customers help people discover their family stories and gain actionable insights about their health and wellness.
About the Project and Team:
You will join the Data Science Engineering team and work on DNA research projects. One of our projects is a prediction of people’s traits using SNPs.
As a part of the team, you will work on infrastructure and research activities, such as setting up EMR, Data Lake management/governance, cloud-environment activities, workflow automation, data engineering, and analytics.
Technologies stack: Python 3.8-3.11 / Django / MySQL / Nextflow / Airflow / PySpark / Docker / AWS (IAM, S3, EC2, FSx for Lustre) / Kubernetes
Responsibilities will include:
Help architect, design, and develop complex, large-scale systems that process billions of records every day
Development of ETL pipeline using Spark and Airflow
Design and implement a Nextflow pipeline to process SNPs
Working with data processing/engineering/analytics
Working with cloud-environment (AWS services)
Identify opportunities to adopt innovative technologies and automation workflow
Write code and unit tests
Conduct code reviews
Diagnose complex problems involving multiple systems and technologies
Be an example of engineering excellence
Our ideal candidate will have good Python skills, the right mixture of critical thinking, a can-do attitude, solid programming fundamentals, an understanding of time series data, and the ability to calculate summary statistics for data samples.
Requirements:
Knowledge or experience with Bioinformatics tools & DBs: BLAST, GATK, NCBI, UCSC Genome browser, etc.
5+ years of commercial experience with Python
Commercial experience with relational databases (MySQL is preferable)
Commercial experience with orchestration tools (Airflow / Nextflow is preferable)
Experience with AWS (S3, EC2)
Experience with CI/CD
English: Upper-intermediate at least (both spoken and written)
It will be a plus:
Strong knowledge or commercial experience with PySpark
Strong knowledge or commercial experience with Django or Flask
Strong knowledge or commercial experience with Rust
Experience with Docker and Kubernetes
Knowledge or commercial experience with Scikit-learn
Experience with AWS FSx for Lustre and SageMaker
Strong knowledge or commercial experience with Java
Knowledge or experience with ML
What do we offer our new colleague?
Competitive compensation (based on market data but also depending on the technical level of the candidate)
Flexible work schedule
3 health packages to choose
Annual paid vacation and state holiday celebration
Free English classes (online)
Individual approach to professional growth
Lack of bureaucracy and micromanagement
Modern, comfortable office facilities (a barbecue zone, kitchens, lounge rooms, coffee machines, etc.)
Foreign business trips
On-site parking lot and charge station for Electric Cars
Corporate gifts, celebrations, and fun activities
Sports activities: ping-pong, soccer, work-out
If you have a passion for solving challenging problems; building scalable, robust systems; love working with the latest technologies in a fast-paced, flexible environment; and are excited at the prospect of having a significant impact on products which has more than 3 million paying subscribers, then we want to talk to you! ;-)
Відділ персоналу