D
Den4ik Research
@den4ikresearch1.7K подп.
6.0Kпросмотров
2 июня 2025 г.
Score: 6.7K
Спасибо Илье и донатерам за поддержку. Теперь некоторые технические детали: В датасете будет 2-5к часов аудио (скорее всего больше) Формат: mp3, 16bit depth, 44100, 320kbps Речь разговорная, но некоторая примесь читающей (книги) тоже будет. Разметка eMOS для каждого сэмпла Длина сэмплов 1-3 предложения Разметка таймстемпов слов (получена через wav2vec2) * Разметка ударений (обычные слова по словарю, омографы - по аудио) Я надеюсь, что мне удастся выполнить задуманное. Штош, начнем снова поднимать опенсурс с колен.
6.0K
просмотров
534
символов
Нет
эмодзи
Нет
медиа

Другие посты @den4ikresearch

Все посты канала →
Спасибо Илье и донатерам за поддержку. Теперь некоторые техн — @den4ikresearch | PostSniper