1.4Kпросмотров
76.2%от подписчиков
3 марта 2026 г.
Score: 1.6K
Тут NVIDIA открыла исходный код Personaplex — модели для голосового общения, которая работает в реальном времени и умеет поддерживать любую роль и голос.
Модель очень крутая. Personaplex — это полнодуплексная (full-duplex) speech-to-speech модель на 7 млрд параметров, которая: • слушает и говорит одновременно — как живой собеседник; • работает с минимальной задержкой (~200 мс); • поддерживает текстовые промпты для роли + аудио-примеры для голоса; • понимает перебивания, паузы, междометия («угу», «ага», «понял»). Держите ссылки
GitHub репозиторий
Страница исследования NVIDIA
Научная статья на arXiv
Модель на Hugging Face
Демка ))) ⚠️ Важно: Для запуска нужен токен Hugging Face и согласие с лицензией модели. Полная инструкция — в README репозитория.