🚀 Опубликовал самый большой датасет для синтеза речи на баш — @homai_ru

3.9Kпросмотров

15 августа 2025 г.

Score: 4.3K

🚀 Опубликовал самый большой датасет для синтеза речи на башкирском языке 🎙 Состав датасета: - 7 женских + 1 мужской голос - 62 852 аудиофайла 💡 Как собирал: 1. Диктор (женский голос) записал ~15 часов аудио на башкирском. 2. С помощью клонирования голоса в ElevenLabs создал ещё 8 голосов, включая мужской! 3. В итоге — большой мультиголосовой датасет для TTS. 🔥 Фишка подхода: - Можно записать данные от одного диктора - Клонировать и получить разные голоса - Эти голоса ElevenLabs могут синтезировать речь и на других языках. 📌 У нас есть голос, который говорит на башкирском, марийском, русском и английском. 👉 Датасет на HuggingFace: https://huggingface.co/datasets/AigizK/bashkort_tts_dataset

Другие посты @homai_ru