🚀 Tencent выкатывает Covo-Audio (7B) - новый уровень голосо — @data_analysis_ml

3.6Kпросмотров

6.9%от подписчиков

26 марта 2026 г.

📷 ФотоScore: 4.0K

🚀 Tencent выкатывает Covo-Audio (7B) - новый уровень голосовых AI. Это уже не просто “распознал → ответил → озвучил”. Модель умеет говорить и слушать одновременно. Что внутри: • Qwen2.5-7B + Whisper • 8 млн часов аудио обучения • full-duplex — диалог без пауз Главное отличие: Нет отдельных пайплайнов ASR и TTS. → всё работает как единая модель Что это даёт: • можно перебивать (barge-in) • естественный разговор, как с человеком • меньше задержек • меньше костылей в архитектуре Отдельно: Разделение интеллекта и голоса → проще делать voice cloning → гибкость под разные сценарии Тренд очевиден: AI переходит от “голосовых интерфейсов” → к полноценному живому диалогу Скоро кнопка “нажми и говори” исчезнет совсем. Модель: https://huggingface.co/tencent/Covo-Audio-Chat

Другие посты @data_analysis_ml