Һ
Һомай
@homai_speaker1.2K подп.
2.1Kпросмотров
15 августа 2025 г.
Score: 2.3K
🚀 Опубликовал самый большой датасет для синтеза речи на башкирском языке 🎙 Состав датасета: - 7 женских + 1 мужской голос - 62 852 аудиофайла 💡 Как собирал: 1. Диктор (женский голос) записал ~15 часов аудио на башкирском. 2. С помощью клонирования голоса в ElevenLabs создал ещё 8 голосов, включая мужской! 3. В итоге — большой мультиголосовой датасет для TTS. 🔥 Фишка подхода: - Можно записать данные от одного диктора - Клонировать и получить разные голоса - Эти голоса ElevenLabs могут синтезировать речь и на других языках. 📌 У нас есть голос, который говорит на башкирском, марийском, русском и английском. 👉 Датасет на HuggingFace: https://huggingface.co/datasets/AigizK/bashkort_tts_dataset
2.1K
просмотров
705
символов
Да
эмодзи
Нет
медиа

Другие посты @homai_speaker

Все посты канала →