Пошук роботи на robota.uaukraine
Віддалена робота

Senior AI Engineer

2 тижні тому
21 листопада 2025
Київ
Віддалена робота
Неповна зайнятість

Компанія BusinessTwin в пошуку досвідченого Senior AI Engineer, який здатний глибоко аналізувати, перебудовувати та оптимізувати складні AI-архітектури на основі LLM. Наш продукт уже працює в production, але потребує суттєвого покращення якості пошуку, індексації та роботи з великими документами. Нам потрібен спеціаліст, який не лише виявить проблеми, але й особисто впровадить рішення та допоможе команді масштабувати систему.

Ваші ключові завдання:

1. Аудит існуючої системи

  • Аналіз архітектури RAG-пайплайнів (Python FastAPI + LangChain).

  • Оцінка документного пайплайну (PDF/DOCX/XLSX/Images + OCR).

  • Перевірка роботи з Weaviate: індексація, retrieval, chunking.

  • Виявлення причин низької релевантності пошуку.

  • Формування пріоритетного плану рефакторингу.

2. Перебудова та оптимізація

  • Розробка ефективної стратегії chunking під різні типи документів.

  • Оптимізація embedding-пайплайнів та індексації у Weaviate.

  • Покращення RAG-архітектури (hybrid search, reranking, multi-pipeline ingestion).

  • Налаштування метрик якості пошуку, RAG-evaluation та моніторингу.

  • Оптимізація витрат на inference, latency та throughput.

  • Інтеграція змін з існуючим Chat API.

3. Розв’язання складних прикладних кейсів

  • Hierarchical retrieval у випадку фрагментованого контексту.

  • Map-reduce або selective summarization для великих документів.

  • Agent orchestration з memory windows.

  • Multi-vector retrieval та cross-encoder re-ranking.

  • Multi-pipeline ingestion для різнорідних форматів.

4. Knowledge Transfer

  • Документація архітектури та впроваджених рішень.

  • Навчання dev-команди (Python/Node.js).

  • Налаштування системи моніторингу й контролю якості.

Очікуваний результат:

  • Оптимізована RAG-архітектура з вимірюваним покращенням пошуку.

  • Системна обробка великих і складних документів.

  • Зменшення галюцинацій та підвищення точності відповідей.

  • Документація та best practices для подальшої підтримки.

Необхідні компетенції:

Must Have

  • Досвід побудови production RAG-систем.

  • Робота з Weaviate або іншими vector DB (Pinecone, Qdrant, Milvus).

  • Глибоке розуміння semantic search, hybrid search, embedding models.

  • Hands-on досвід з LangChain (Python).

  • Сильні навички Python (FastAPI як плюс).

  • Parsing/OCR (PDF, DOCX, XLSX, Images).

  • Досвід проектування комплексних LLM-систем (5–15 компонентів).

  • Розуміння attention, logits, контекстних обмежень і причин галюцинацій.

Nice to Have

  • RAG evaluation frameworks (RAGAS, LangSmith).

  • Оптимізація вартості та продуктивності LLM-систем.

  • Мікросервісна архітектура.

  • Node.js/TypeScript на базовому рівні.

  • PostgreSQL для роботи з метаданими.

Наш технічний стек:

Backend: Python (FastAPI), LangChain, Node.js (Fastify), Go

AI: RAG, OCR, semantic search, embedding models

Data: PostgreSQL, Weaviate, MinIO, Redis

Frontend: React + TypeScript + Vite

Архітектура: Мікросервіси, WebSocket, REST


Що ми пропонуємо

  • ? Заробітна плата: визначається індивідуально на основі досвіду, технічних компетенцій та очікувань кандидата. Ми відкриті до розгляду запропонованого рівня винагороди.

  • Гнучкий формат роботи: повністю віддалено, часткова зайнятість (part-time).

  • Можливість впливати на архітектуру продукту, який уже використовується бізнесами та знаходиться у стадії активного масштабування.

  • Складні технічні задачі, що виходять за рамки класичного RAG і потребують творчого інженерного підходу.

  • Швидке ухвалення рішень в команді, мінімум бюрократії та повна прозорість процесів.

  • Співпраця з сильною інженерною командою, яка відкрита до нових технологій та архітектурних рішень.

  • Реальний внесок у розвиток AI-платформи нового покоління, яка формує ринок автоматизації документообігу.

Роман

Схожі вакансії