3.6Kпросмотров
6.9%от подписчиков
26 марта 2026 г.
📷 ФотоScore: 4.0K
🚀 Tencent выкатывает Covo-Audio (7B) - новый уровень голосовых AI. Это уже не просто “распознал → ответил → озвучил”. Модель умеет говорить и слушать одновременно. Что внутри:
• Qwen2.5-7B + Whisper • 8 млн часов аудио обучения • full-duplex — диалог без пауз Главное отличие: Нет отдельных пайплайнов ASR и TTS. → всё работает как единая модель Что это даёт:
• можно перебивать (barge-in) • естественный разговор, как с человеком • меньше задержек • меньше костылей в архитектуре Отдельно: Разделение интеллекта и голоса → проще делать voice cloning → гибкость под разные сценарии Тренд очевиден: AI переходит от “голосовых интерфейсов” → к полноценному живому диалогу Скоро кнопка “нажми и говори” исчезнет совсем. Модель: https://huggingface.co/tencent/Covo-Audio-Chat