Компанія BusinessTwin в пошуку досвідченого Senior AI Engineer, який здатний глибоко аналізувати, перебудовувати та оптимізувати складні AI-архітектури на основі LLM. Наш продукт уже працює в production, але потребує суттєвого покращення якості пошуку, індексації та роботи з великими документами. Нам потрібен спеціаліст, який не лише виявить проблеми, але й особисто впровадить рішення та допоможе команді масштабувати систему.
Ваші ключові завдання:
1. Аудит існуючої системи
Аналіз архітектури RAG-пайплайнів (Python FastAPI + LangChain).
Оцінка документного пайплайну (PDF/DOCX/XLSX/Images + OCR).
Перевірка роботи з Weaviate: індексація, retrieval, chunking.
Виявлення причин низької релевантності пошуку.
Формування пріоритетного плану рефакторингу.
2. Перебудова та оптимізація
Розробка ефективної стратегії chunking під різні типи документів.
Оптимізація embedding-пайплайнів та індексації у Weaviate.
Покращення RAG-архітектури (hybrid search, reranking, multi-pipeline ingestion).
Налаштування метрик якості пошуку, RAG-evaluation та моніторингу.
Оптимізація витрат на inference, latency та throughput.
Інтеграція змін з існуючим Chat API.
3. Розв’язання складних прикладних кейсів
Hierarchical retrieval у випадку фрагментованого контексту.
Map-reduce або selective summarization для великих документів.
Agent orchestration з memory windows.
Multi-vector retrieval та cross-encoder re-ranking.
Multi-pipeline ingestion для різнорідних форматів.
4. Knowledge Transfer
Документація архітектури та впроваджених рішень.
Навчання dev-команди (Python/Node.js).
Налаштування системи моніторингу й контролю якості.
Очікуваний результат:
Оптимізована RAG-архітектура з вимірюваним покращенням пошуку.
Системна обробка великих і складних документів.
Зменшення галюцинацій та підвищення точності відповідей.
Документація та best practices для подальшої підтримки.
Необхідні компетенції:
Must Have
Досвід побудови production RAG-систем.
Робота з Weaviate або іншими vector DB (Pinecone, Qdrant, Milvus).
Глибоке розуміння semantic search, hybrid search, embedding models.
Hands-on досвід з LangChain (Python).
Сильні навички Python (FastAPI як плюс).
Parsing/OCR (PDF, DOCX, XLSX, Images).
Досвід проектування комплексних LLM-систем (5–15 компонентів).
Розуміння attention, logits, контекстних обмежень і причин галюцинацій.
Nice to Have
RAG evaluation frameworks (RAGAS, LangSmith).
Оптимізація вартості та продуктивності LLM-систем.
Мікросервісна архітектура.
Node.js/TypeScript на базовому рівні.
PostgreSQL для роботи з метаданими.
Наш технічний стек:
Backend: Python (FastAPI), LangChain, Node.js (Fastify), Go
AI: RAG, OCR, semantic search, embedding models
Data: PostgreSQL, Weaviate, MinIO, Redis
Frontend: React + TypeScript + Vite
Архітектура: Мікросервіси, WebSocket, REST
Що ми пропонуємо
? Заробітна плата: визначається індивідуально на основі досвіду, технічних компетенцій та очікувань кандидата. Ми відкриті до розгляду запропонованого рівня винагороди.
Гнучкий формат роботи: повністю віддалено, часткова зайнятість (part-time).
Можливість впливати на архітектуру продукту, який уже використовується бізнесами та знаходиться у стадії активного масштабування.
Складні технічні задачі, що виходять за рамки класичного RAG і потребують творчого інженерного підходу.
Швидке ухвалення рішень в команді, мінімум бюрократії та повна прозорість процесів.
Співпраця з сильною інженерною командою, яка відкрита до нових технологій та архітектурних рішень.
Реальний внесок у розвиток AI-платформи нового покоління, яка формує ринок автоматизації документообігу.
Роман








