Ця вакансія вже завершена
UKEESS Software House шукає Senior AI LLM Data Scientist / Engineer на повний робочий день (або в офісі у Львові, або з можливістю віддаленої співпраці в Україні).
Про проект нашого клієнта:
Це один з найбільших у світі ресурсів по дослідженню сімейної історії та оцифровці ДНК (клієнт із США). За допомогою цього сервісу можна побудувати своє сімейне дерево, дослідити свій родовід, дізнатись цікаві факти про своїх предків і знайти родичів на базі у понад 60 млрд оцифрованих архівних записів (+ ця цифра постійно росте). Також за допомогою ДНК-аналізу, наприклад, можна знайти родичів, визначити етнічне походження, особливості тілобудови тощо (зараз - це майже 100 визначень по днк-аналізу). Загалом, наш замовник вважається найбільшим у своїй бізнес-ніші!
Про команду:
Ви приєднаєтеся до команди AI Content, динамічної групи, яка працює з Document Understanding. Ви відіграватимете важливу роль у розробці інноваційних АІ моделей, які витягують та впорядковують текстову та графічну інформацію з мільярдів історичних та генеалогічних записів, дозволяючи клієнтам знаходити, ділитися та зв'язуватися зі своєю сімейною історією.
Як учасник команди AI Content, ви працюватимете з технологіями АІ та LLM для розгортання, тестування та оцінки можливостей моделей, якості, пропускної здатності та вартості для завдань Document Understanding, таких як аналіз макета, транскрипція, розпізнавання сутностей, вилучення зв'язків, узагальнення тощо. Ви працюватимете у команді AI Content з обробки даних, а також з інженерними командами, щоб навчати, оптимізувати та розгортати моделі, що сприяють розробці продуктів, успіху клієнтів та створенню контенту в рамках нашого проекту.
Обов'язки:
Інтеграція LLM: інтеграція як LLM з відкритим кодом, так і LLM на основі постачальників у внутрішній AI Gateway.
Оптимізація LLM: оптимізація LLM з відкритим кодом для швидшого виведення за допомогою таких фреймворків, як VLLM, SGLang.
Інструменти / Скрипти / Інформаційні панелі: створення інструментів / скриптів / інформаційних панелей для відстеження та порівняння швидкості або необхідного часу, а також кількості токенів та оцінки вартості обробки зображень за допомогою різних LLM.
Додаткові можливості: робота з додатковими можливостями для дослідження виявлення обмежувальних рамок слів у LLM, LLM як Judge та іншої роботи з оцінювання LLM.
Співпраця над розгортанням у хмарі: тісна співпраця з ML Ops та інженерами з обробки даних для безперешкодного розгортання наборів даних, truth sets, моделей та пайплайнів для навчання та виведення у хмарних середовищах.
Ефективна комунікація: чітка та впевнена презентація своїх висновків, результатів і рішень технічній та нетехнічній аудиторії, включаючи команди, стейкхолдерів і керівників.
Технічні вимоги:
5+ років досвіду роботи в галузі AI/ML або Data Science.
Поглиблені знання і досвід роботи з Python, а також інструментами та середовищами для розгортання моделей.
Знання та досвід роботи з кількома AI LLM, включаючи як закриті, так і моделі з відкритим кодом, а також їхні відповідні сильні сторони та обмеження.
Знання та досвід роботи з такими фреймворками, як VLLM, SGLang.
Здатність бути в курсі нових моделей, бенчмарків та передового досвіду.
Практичний досвід роботи з хмарними сервісами AWS (наприклад, Amazon SageMaker, EC2, S3, AWS Lambda).
Англійська - вище середнього рівня (розмовна і письмо).
Буде перевагою:
Знання і досвід хмарних платформ і пов'язаних АІ/ML-сервісів, таких як Google GCP Gemini API, Vertex AI, Azure тощо.
Комерційний досвід роботи з Terraform або CloudFormation
Досвід роботи з агентною архітектурою
Знайомство з інструментами АІ-кодування
Що ви здобудете у цій ролі:
Менторство та професійний ріст: підтримка від досвідчених Data Scientist-ів і робота над реальними AI-проектами. Можливість розширити свої знання та професійну мережу в рамках культури співпраці.
Співпраця та вплив: можливість долучитися до команди топових фахівців, що формує інноваційні підходи у сфері Document Understanding.
Інновації та мета: ваш внесок допоможе мільйонам користувачів по всьому світу краще пізнати своє коріння.
Що ми пропонуємо новому колезі?
Конкурентоспроможна компенсація (на основі ринкових даних, але також залежить від технічного рівня кандидата)
Гнучкий графік роботи
Щорічна оплачувана відпустка
Безкоштовні уроки англійської (онлайн)
Медичне страхування або дві альтернативи на вибір
Індивідуальний плани для професійного та особистісного розвитку
Відсутність бюрократії та мікро менеджменту
Сучасні енергозабезпечені комфортні офіси у Львові (зона барбекю, кухні, кімнати відпочинку та ін.)
Парковка на території та зарядна станція для електромобілів
Закордонні відрядження (після війни)
Корпоративні подарунки, свята та розваги
Спортивні активності: настільний теніс, футбол, воркаут
Надішліть нам своє резюме і давайте познайомимося! ;)
--------------------------------------------------------------------------------------------------------------------
The UKEESS Software House team is currently looking for a Senior AI LLM Data Scientist / Engineer to join our team for a full-time position (remotely in Ukraine or in Lviv's office).
About the Customer and the Project:
Our customer is the world's largest DNA network, based in the USA. This presents a unique opportunity to work with more than 60 billion digitized global historical records, 100 million family trees, and 18+ million people in their growing database. Our customers help people discover their family stories and gain actionable insights about their health and wellness.
About the team:
You will join the AI Content team, a dynamic group at the forefront of Document Understanding. You’ll play a vital role in developing innovative AI models that extract and organize text and image information from billions of historical and genealogical records, enabling customers to discover, share, and connect with their family history.
As a member of the AI Content team, you will work with AI technologies and LLMs to deploy, test, and evaluate model capabilities, quality, throughput, and cost for document understanding tasks such as layout analysis, transcription, entity recognition, relation extraction, summarization, etc. You will work with a dedicated mentor on the AI Content data science team, along with engineering teams, to train, optimize, and deploy models that promote product development, customer success, and content creation across our project.
What you will do:
Integrate LLMs: Integrate both open source and provider-based LLMs into our internal AI Gateway.
LLM Optimization: Optimizing open source LLMs for faster inference using frameworks like VLLM, SGLang
Tools / Scripts / Dashboards: build a tool / script / dashboard to track and compare speed or time required, as well as token count and cost estimates for processing images with the various LLMs.
Optional Opportunities: Optional opportunities exist to explore LLM word token bounding box detection, LLM as a Judge, and other LLM evaluation work.
Collaborate on Cloud Deployment: Partner closely with ML Ops and Data Science Engineers to seamlessly deploy datasets, truth sets, models, and pipelines for training and inference in cloud environments.
Communicate Insights Effectively: Clearly and confidently present your findings, deliverables, and proposed solutions to technical and non-technical audiences, including teams, stakeholders, and executives.
Requirements:
5+ years of experience in Data Science with AI/ML
Proven experience in Python programming as well as tools and environments for model deployment.
Knowledge and experience with multiple AI LLMs, including both proprietary and open-source models, and their respective strengths and limitations.
Knowledge and experience with such frameworks as VLLM, SGLang
Ability to stay up-to-date with new models, benchmarks, and best practices.
Practical experience with cloud platform AWS (e.g. Amazon SageMaker, EC2, S3, AWS Lambda).
English: Upper-intermediate at least (both spoken and written)
It will be a plus:
Familiarity with cloud platforms and related AI/ML services such as Google GCP Gemini API, Vertex AI, Azure, etc.
Commercial experience with Terraform or CloudFormation
Experience with agentic architecture
Familiarity with AI coding tools
What You’ll Gain
Mentorship & Growth: Learn from experienced Data Scientists while tackling meaningful, real-world AI projects, expanding your knowledge and professional network within a collaborative culture.
Collaboration & Impact: Work alongside top industry professionals and help shape the tools that bring family history to life for millions of users.
Innovation & Purpose: Join a team at the forefront of applying AI to historical data - where every model you build helps preserve human stories.
What do we offer our new colleague?
Competitive compensation (based on market data, but also depending on the technical level of the candidate)
Flexible work schedule
3 health packages to choose from
Annual paid vacation and state holiday celebration
Free English classes (online)
Individual approach to professional growth
Lack of bureaucracy and micromanagement
Modern, comfortable office facilities (a barbecue zone, kitchens, lounge rooms, coffee machines, etc.)
Foreign business trips (after the war)
On-site parking lot and charge station for Electric Cars
Corporate gifts, celebrations, and fun activities
Sports activities: ping-pong, soccer, work-out
Suppose you have a passion for solving challenging problems, building scalable, robust systems, love working with the latest technologies in a fast-paced, flexible environment, and are excited about the prospect of having a significant impact on products with more than 3 million paying subscribers.
In that case, we want to talk to you! ;-)
Відділ персоналу




