12просмотров
0.6%от подписчиков
1 февраля 2026 г.
📷 ФотоScore: 13
Alibaba Cloud открыла доступ к моделям и исходному коду семейства Qwen3-TTS — системе для синтеза речи, объединяющей генерацию голоса из текста, создание голосового тембра по описанию и клонирование голоса по короткому аудиофрагменту. В релиз вошли две версии моделей — на 0,6 и 1,7 млрд параметров, а также речевой токенизатор. Он обеспечивает потоковую озвучку с задержкой около 97 мс, что позволяет использовать систему в реальном времени, включая разговорные интерфейсы и голосовых ассистентов.