4.8Kпросмотров
10 ноября 2025 г.
Score: 5.3K
Мои коллеги выкатили Omnilingual ASR: новое семейство моделей для распознавания речи (считайте, следующая версия моделей MMS), которые поддерживают полторы тыщи языков и могут поддержать новые языки в режиме few-shot in-context learning — и при этом на мэйнстримных языках типа русского приближаются по качеству к Whisper (хоть и не поддерживают пунктуацию и прописные буквы). Чекпойнты, код, веб демка и статья прилагаются. Есть маленькие модели (от 300M параметров), которые должно быть несложно дообучить специализироваться на вашем языке. Плюс есть модели побольше, с толстым декодером, которые можно дообучить на прямой перевод речи сразу в текст на другом языке.
Все ссылки тут: https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition/ И да, в обозримом будущем, скорее всего, мы вас порадуем и другими omnilingual моделями 🙃