3.9Kпросмотров
15 августа 2025 г.
Score: 4.3K
🚀 Опубликовал самый большой датасет для синтеза речи на башкирском языке 🎙 Состав датасета: - 7 женских + 1 мужской голос
- 62 852 аудиофайла 💡 Как собирал: 1. Диктор (женский голос) записал ~15 часов аудио на башкирском.
2. С помощью клонирования голоса в ElevenLabs создал ещё 8 голосов, включая мужской!
3. В итоге — большой мультиголосовой датасет для TTS. 🔥 Фишка подхода: - Можно записать данные от одного диктора
- Клонировать и получить разные голоса
- Эти голоса ElevenLabs могут синтезировать речь и на других языках. 📌 У нас есть голос, который говорит на башкирском, марийском, русском и английском. 👉 Датасет на HuggingFace:
https://huggingface.co/datasets/AigizK/bashkort_tts_dataset