Віддалена робота
Повна зайнятість
Корпоративні заходи
Курси іноземної мови
Стабільний розвиток фахівця можливий лише за умови стабільності його команди. Ми в NIX шукаємо Middle Data Scientist, і ми впевнені, що такий фахівець продовжить професійно зростати і зможе досягти нових кар'єрних висот.
ЧИМ ТИ БУДЕШ ЗАЙМАТИСЯ:
- Співпрацювати з командою над впровадженням нових функцій для підтримки зростаючих потреб науки про дані.
- Створювати масштабовані конвеєри та робочі процеси ML для обробки даних у реальному часі або пакетної обробки: пошук даних, попередня обробка, інженерія функцій, навчання та виведення моделей, аналіз і візуалізація результатів.
- Ділитися знаннями з іншими командами щодо тем, пов’язаних з наукою про дані та проєктами.
- Визначати разом із командою оптимальні інструменти та стратегії для конкретних сценаріїв.
- Самостійно розробляти та впроваджувати рішення відповідно до потреб і вимог зацікавлених сторін.
- Чітко та вчасно інформувати всі зацікавлені сторони (як технічних, так і нетехнічних спеціалістів) про прогрес, проблеми та можливі рішення.
- Наставляти молодших членів команди, надавати конструктивний зворотний зв’язок і сприяти їхньому розвитку.
ЩО ТОБІ ЗНАДОБИТЬСЯ:
- 3+ роки досвіду з ML та DL з комерційними проєктами в портфоліо.
- Ступінь магістра в галузі комп'ютерних наук, науки про дані або суміжних галузях.
- Рівень англійської мови B2+.
- Хороша експертиза принаймні в одній з областей: NLP, CV, класичний ML, GenAI.
- Ґрунтовні математичні знання (лінійна алгебра, математичний аналіз, оптимізація, статистика) та знання тензорного числення.
- Добре знання мови програмування Python та принципів об'єктно-орієнтованого програмування (ООП).
- Добре знання принаймні однієї бази даних, наприклад, MySQL, Postgres, MongoDB, а також хороші знання SQL.
- Ґрунтовні знання класичних методів машинного навчання (наприклад, лінійна регресія, логістична регресія, k-NN, дерева рішень, випадкові ліси, SVM, бустінг, k-середні, DBSCAN, наївний Байєс, PCA).
- Досвід взаємодії з бібліотеками Numpy, Pandas, Matplotlib, Langchain та Scikit-learn.
- Знання класичних метрик оцінювання, таких як точність, згадування, ROC AUC, PR AUC, оцінка F1, специфічність, чутливість, матриця плутанини, MSE, MAE, R1, RMSE, MAPE, MSLE.
- Знання алгоритмів градієнтного бустингу (XGBoost або LightGBM).
- Досвід взаємодії принаймні з одним фреймворком для побудови та навчання нейронних мереж (TensorFlow/Keras, PyTorch).
- Глибоке розуміння архітектури нейронних мереж, цільових функцій навчання, оптимізаторів, функцій активації та метрик оцінювання; вміння визначати конкретні випадки використання та обмеження для кожного з них.
- Глибокі знання хмарних концепцій та практичний досвід принаймні в одній з хмар: AWS (наприклад, Sagemaker, Bedrock, Comprehend), Azure (наприклад, Azure ML Studio, Azure Rekognition, OpenAI Service), GCP (наприклад, Vertex AI, Agent Builder, AI Vision).
- Практичні навички швидкого інженерінгу (few-shot learning, CoT, Self-Consistency), RAG (Naive Retriever, Parent Document Retriever, Self-Query Retriever) та векторні сховища (наприклад, Chroma, FAISS).
- Знання хмарних сервісів, пов'язаних зі штучним інтелектом, таких як AWS Textract, AWS Converse API, AWS Builder, Azure Translator, Azure AI Vision, Azure AI Foundry, Vertex AI Agent Builder.
- Знання агентів LLM.
- Практичні навички побудови наскрізних конвеєрів навчання ML (завантаження даних, препроцес, навчання, висновок), а також потоків GitHub / GitLab CI/CD.
- Досвід з платформою Docker або Kubernetes.
- Досвід розробки веб-мікросервісів (API, Flask, FastAPI).
- Практичний досвід з інструментами розробки та управління проектами (git, pip, Jira тощо).
- Бути проактивним учасником команди.
БУДЕ ПЕРЕВАГОЮ:
- Практичний досвід принаймні в одній з хмар з наступними сервісами: AWS (Lambda, Athena, S3), Azure (Azure Functions, Azure Synapse Analytics або Databricks), GCP (Cloud Functions, BigQuery).
- Практичний досвід принаймні з декількома хмарними сервісами, такими як AWS Textract, AWS Converse API, Azure Translator, Azure AI Vision, Azure AI Foundry.
- Вміння працювати з Spark/PySpark, Airflow.
- 2+ роки комерційного досвіду роботи з NLP/CV.
Для області NLP:
- Досвід з NLP фреймворками, такими як LangChain, HuggingFace, LlamaIndex, NLTK, spaCy.
- Практичний досвід створення додатків на основі LLM-агентів з використанням таких фреймворків, як LangGraph або Crew.ai.
- Знайомство з фреймворками швидкої оптимізації, такими як DSPy, textgrad, «ell» тощо;
- Практика створення LLM-агентів за допомогою LangChain.
- Хороші знання різних метрик оцінки NLP, таких як BERTScore, RAGAS, BLEU, ROUGE і Perplexity.
- Практичний досвід принаймні з однією векторною базою даних (Pinecone, Weaviate, pgvector розширення PostgreSQL тощо).
- Знання архітектур великих мовних моделей (LLM) (OpenAI GPT, Anthropic Claude тощо).
- Знання методів PEFT або тонкого налаштування LLM.
Для домену CV:
- Базові методи CV (CNN, алгоритм згортки, об'єднання шарів, доповнення даних у CV).
- Розуміння проблем комп'ютерного зору (NLP): класифікація об'єктів, виявлення об'єктів, семантична сегментація, виявлення та розпізнавання тексту (OCR), передача стилю.
- Знання фреймворків CV, таких як OpenCV, YOLO.
- Знання архітектур моделей комп'ютерного зору (CNN, ResNet, Mask R-CNN).
- Практичний досвід з моделями/технологіями КНМ (SIFT, Transfer Learning, FCN, U-Net, StyleGAN).
ЩО МИ ЗАЛЮБКИ ЗАПРОПОНУЄМО ТОБІ:
- Довгострокову стратегію вашого розвитку як експерта.
- Участь у великих міжнародних проектах, які дозволяють освоювати нові технології та домени.
- Освітні заходи та професійні тренінги, які допоможуть побудувати стабільний кар'єрний шлях.
- Гнучку систему винагород, де ваш дохід буде залежати тільки від вас і вашого бажання розвиватися.
- Дружню та затишну корпоративну культуру з мінімальним рівнем формальності та бюрократії.
Щоб розпочати успішну кар'єру в NIX, надсилайте своє резюме на адресу Відправити резюме . Будемо раді долати нові професійні виклики разом з вами!
Ксения