6.0Kпросмотров
2 июня 2025 г.
Score: 6.7K
Спасибо Илье и донатерам за поддержку. Теперь некоторые технические детали: В датасете будет 2-5к часов аудио (скорее всего больше) Формат: mp3, 16bit depth, 44100, 320kbps Речь разговорная, но некоторая примесь читающей (книги) тоже будет. Разметка eMOS для каждого сэмпла Длина сэмплов 1-3 предложения Разметка таймстемпов слов (получена через wav2vec2)
* Разметка ударений (обычные слова по словарю, омографы - по аудио) Я надеюсь, что мне удастся выполнить задуманное. Штош, начнем снова поднимать опенсурс с колен.