Х
Хомай/Homai/Һомай
@homai_ru530 подп.
3.9Kпросмотров
15 августа 2025 г.
Score: 4.3K
🚀 Опубликовал самый большой датасет для синтеза речи на башкирском языке 🎙 Состав датасета: - 7 женских + 1 мужской голос - 62 852 аудиофайла 💡 Как собирал: 1. Диктор (женский голос) записал ~15 часов аудио на башкирском. 2. С помощью клонирования голоса в ElevenLabs создал ещё 8 голосов, включая мужской! 3. В итоге — большой мультиголосовой датасет для TTS. 🔥 Фишка подхода: - Можно записать данные от одного диктора - Клонировать и получить разные голоса - Эти голоса ElevenLabs могут синтезировать речь и на других языках. 📌 У нас есть голос, который говорит на башкирском, марийском, русском и английском. 👉 Датасет на HuggingFace: https://huggingface.co/datasets/AigizK/bashkort_tts_dataset
3.9K
просмотров
705
символов
Да
эмодзи
Нет
медиа

Другие посты @homai_ru

Все посты канала →
🚀 Опубликовал самый большой датасет для синтеза речи на баш — @homai_ru | PostSniper