Національний корпус кримськотатарської мови (НККМ) — винятковий у своєму роді електронний масив кримськотатарських текстів, що охоплює різні жанри та історичні епохи. НККМ варто розглядати, як інструмент для всеосяжних лінгвістичних досліджень, а також створення та розвитку найрізноманітніших автоматизованих систем (розпізнання мови, машинного перекладу, інформаційного пошуку). Створення і розбудова лінгвістичного корпусу є особливо важливим чинником розвитку кримськотатарської мови, яка на сьогодні класифікується ЮНЕСКО, як мова, що перебуває під серйозною загрозою зникнення.
Завданням спеціаліста є розпізнавання, форматування і корегування текстів та книг кримськотатарською мовою. Основна частина роботи буде проходити в Microsoft Word та OCR програмах. Матеріали потрібно буде переносити у формат PDF з можливістю пошуку та DOCX.
Обов’язки:
- Розпізнавання та порівняння тексту. Виконання розпізнавання тексту із формату зображення, PDF та інших форматів, а також порівняння отриманого тексту відповідно до його оригіналу, включаючи виправлення помилок розпізнавання та інші корекції.
- Форматування тексту: Ви також займатиметеся форматуванням тексту, зберігаючи вигляд оригіналу та дотримуючись наданих вимог до документа.
Вимоги:
- Уважність до деталей, адже вам потрібно буде повторити оригінальний текст із точністю до символу.
- Досвід роботи в Microsoft Word та OCR буде перевагою.
Умови:
- Робота віддалено.
- Гнучкий графік роботи.
HR