13.0Kпросмотров
21 ноября 2025 г.
📷 ФотоScore: 14.3K
📆Делимся секретами про наш новый синтез речи У нас случился релиз GigaTTS. Это наша новая модель синтеза, под капотом у нее GigaChat 3b, свой токенизатор речи, адаптер к LLM и всего 30к часов данных. Метрики космические: новая модель нравится людям в 2-4 раза чаще старой, а по естественности она почти всегда живее. Написали подробный технический обзор на Хабр. Фичи нового синтеза
🔘Естественная freespeech подача, неотличимая от живого человека
🔘Специальные голоса телефонных операторов – таких голосов нет ни у кого
🔘Клонирование голосов, обогнали 11labs instant vc по похожести
🔘Озвучивание текстов бесконечной длины без потери контекста (multiturn режим синтеза)
🔘Инструктивный синтез, где можно задать словами все нюансы эмоций, в том числе сарказм ➡ Послушать новый синтез можно в голосовом режиме GigaChat Voice Mode