G
grokaem себя
@grokaem_seby2.5K подп.
1.4Kпросмотров
55.0%от подписчиков
26 февраля 2026 г.
📷 ФотоScore: 1.5K
Видела довольно много постов о Voicebox в линкедине. Я их пропускала, так как не понимала, почему поднялся хайп на старую модель meta. Оказывается, это сделали ui с запуском on-device qwen и whisper. Overview and download page GitHub page Что можно делать? • voice cloning • распознание текста • просто генерация речи без voice clone Сейчас поддерживается только qwen и whisper, обещают также и другие модели coming soon. Обе модели тяжелые и медленные. Обещают также real-time synthesis. Мой опыт: Вчера я попробовала на личном ноутбуке (Mac m2, 16gb). Заняло время просто скачивание всех моделей и их запуск минут 15. Сам процесс клонирование долгий, но причина не в интерфейсе, а в выборе моделей. Зачем может быть нужен вам? а) вы не программист и вам нужно что-то озвучивать б) вы программист и вам нужно что-то озвучивать, но zero-code.
1.4K
просмотров
860
символов
Нет
эмодзи
Да
медиа

Другие посты @grokaem_seby

Все посты канала →
Видела довольно много постов о Voicebox в линкедине. Я их пр — @grokaem_seby | PostSniper