D
Den4ik Research
@den4ikresearch1.7K подп.
2.9Kпросмотров
2 июня 2025 г.
Score: 3.2K
🚀 Разгоняем open-source-TTS Сегодня я инвестирую в создание открытого корпуса русской речи! Почему это важно? Русские TTS-модели отстают от мирового уровня примерно на два года. Главная причина - это нехватка крупных, качественных и общедоступных датасетов. Без данных сложно быстро тестировать идеи и выпускать новые модели. Кто делает датасет? Знакомый вам Денис @bceloss, уже собирает нужные данные. Грант позволит ему работать над проектом фул-тайм и выложить результат в открытый доступ уже к концу лета. Что это даёт лично мне? Я хочу брать свежие модели с Hugging Face и решать прикладные задачи без глубокого ресёрча и бесконечной поддержки собственных пайплайнов. Чем больше открытых данных, тем быстрее это станет реальностью. Тем больше китайцев, которые обучат свои новые XYITTS на русском языке и тем проще мне решать реально важные задачи. Как помочь уже сейчас? 1. Подпишитесь на канал Дениса @den4ikresearch. 2. Вы можете ему задонатить. 3. Репостните эту новость, чтобы о проекте узнало больше команд. 4. Напишите в комментариях, какие форматы и метаданные вам особенно нужны в корпусе. 5. Публикуйте свои данные и системы!
2.9K
просмотров
1145
символов
Да
эмодзи
Нет
медиа

Другие посты @den4ikresearch

Все посты канала →
🚀 Разгоняем open-source-TTS Сегодня я инвестирую в создание — @den4ikresearch | PostSniper