1.1Kпросмотров
12 февраля 2026 г.
📷 ФотоScore: 1.2K
🔬 Сегодня мы расскажем об одном из наших проектов, который достаточно громко «выстрелил» в прошлом году Представьте: вы наводите камеру телефона на стелу в музее, и мгновенно видите перевод надписи, которой больше трех тысяч лет. Звучит как научная фантастика? Команда нашей лаборатории в составе исследователей из Института AIRI, ИСП РАН и ИТМО уже сделала значительный шаг в этом направлении. Древнеегипетское письмо - это не алфавит из нескольких десятков букв, а сотни уникальных символов, многие из которых визуально похожи друг на друга. Иероглифы группируются в сложные блоки, пишутся в разных направлениях и встречаются на самых разных поверхностях — от папирусов до каменных стел. Автоматически распознать и перевести такой текст — серьезный вызов даже для современных нейросетей . Наши исследователи разработали целую экосистему инструментов: ✔️ Датасеты MEH и MuMMy: первые в мире многостилевые наборы данных для классификации, распознавания и перевода египетских иероглифов. MEH включает 40 изображений с 12 744 размеченными иероглифами и 639 уникальными знаками, а MuMMy — первый мультимодальный датасет, связывающий изображения иероглифов с их транслитерацией и переводом на английский .
✔️ Система генерации синтетических данных: с помощью диффузионных моделей исследователи научились создавать реалистичные изображения иероглифов для обучения нейросетей, что критически важно при нехватке настоящих размеченных данных .
✔️ Инструмент разметки pyThoth: специальный редактор на базе Label Studio с палитрой иероглифов и встроенными моделями OCR и машинного перевода, который ускоряет работу египтологов почти в 6 раз .
✔️ Полный пайплайн перевода от изображения к распознаванию знаков, транслитерации и переводу на современные языки. Пайплайн адаптирован для длинных текстов и AR-приложений . Работы команды приняты на ведущих международных конференциях: ✔️ ACM SIGGRAPH 2025 (постерный доклад о системе интерпретации текстов)
✔️ ACM Multimedia 2025 (две статьи — о датасете MMM и мультимодальном датасете MuMMy)
✔️ ICCV 2025 (статья о датасете MEH и инструментарии для OCR иероглифов)
✔️ IEEE ISMAR 2025 (пайплайн перевода длинных текстов для дополненной реальности) Также в прошлом году мы засветились и в СМИ: 🗣️ О проекте написали РИА Новости, Ferra, Hi-Tech Mail.ru и ряд других изданий. Руководитель проекта Илья Макаров поучаствовал в подкасте на Радио Маяк, где рассказал Александру Пушному о том, как машинное обучение справляется с древнеегипетскими иероглифами, и ответил на вопрос, сможем ли мы наконец узнать, инопланетяне ли построили египетские пирамиды. 📱В проект по-прежнему требуются Египтологи и разметчики для достижения продакшн качества. Кроме того, мы активно работаем над масштабированием наших систем и применяем полученный опыт для исследования других древних языков. ✔️Среди новых направлений — базовые модели в археологии и новые подходы для генерации синтетики, а также новые few-shot подоходы к проблеме машинного перевода. #project #archaeology 🔬 Наш сайт
😌 Наш ТГ