1.0Kпросмотров
23.5%от подписчиков
26 марта 2026 г.
stats📷 ФотоScore: 1.1K
🎉 4 работы на EACL 2026
Хотим поделиться нашими работами, принятыми на одну из ведущих мировых конференций по обработке естественного языка — EACL 2026 в Рабате, Марокко! 🇲🇦 📐 MERA Multi — флагманский проект
Мы создали первый российский бенчмарк MERA Multi для оценки мультимодальных моделей с учетом культурных особенностей русского языка не только в тексте, но и в визуальных образах, интонациях, разговорной речи. Что получилось:
✅ Открытый сайт с лидербордом: https://mera.a-ai.ru/ru/multi
✅ Публичная кодовая база для оценки моделей
✅ Инструмент для российских компаний (Сбер, МТС, Wildberries, Т-Банк и другие), разрабатывающих свои мультимодальные модели 🐲 DRAGOn
Первый бенчмарк, основанный на регулярно обновляемом корпусе новостей. На основе свежих данных автоматически формируется граф знаний и генерируются вопросно-ответные пары. Борется с утечкой данных в претрейн-модели — одной из главных проблем оценки RAG-систем. Полностью автоматизированный пайплайн: парсинг сайтов → генерация QA-пар → оценка моделей. Открытый фреймворк, который можно адаптировать под другие домены (научные статьи, соцсети) и языки. 🕶 FiMMIA
Фреймворк для детектирования утечек данных в мультимодальных LLM на основе семантических пертурбаций. Поддерживает разные модальности: текст, изображения, видео, аудио. 🔬 От трансформеров к современным LLM
Курс за авторством Марии Тихоновой, она же @mashkka_ds Обновили классический курс по NLP, добавив RAG, LLM-агентов и мультимодальные диалоговые модели с практикой на GigaChat. Фокус на прикладных навыках: как строить, оценивать и внедрять современные LLM-решения. Все работы — в открытом доступе. Отдельное спасибо @alenusch за продвижение науки в международном сообществе!💪 #conference #eacl2026 #mera