Первые записи докладов готовы ✅ И они с потока CV & Speech: — @everydaycv

1.7Kпросмотров

29 июля 2024 г.

Score: 1.9K

Первые записи докладов готовы ✅ И они с потока CV & Speech: ▫️Как развитие LLM влияет на будущее голосовых технологий. Евгений Брицын, Head of Speech, Т-Банк ▫️Визуально-текстовая мультимодальность. Роман Исаченко, руководитель подгруппы дискриминативного анализа изображений, Яндекс ▫️Ускорение создания моделей синтеза речи — от обработки данных до production. Валерий Болдаков, Team Lead, Speech Synthesis, Т-Банк ▫️От непризнанного научного бенчмарка до основной метрики качества голоса в VK Звонках. Иван Бескровный, инженер-разработчик в команде звуковых технологий ВКонтакте, VK ▫️Тренды в современном CV. Илларион Дмитриев, Tech Lead, CV, Т-Банк ▫️Генерация речи с помощью LLM. Борис Жестков, Team Lead RnD.TTS, SberDevices ▫️OCR в Т-Банке. Александр Иванов, Tech Lead, CV, Т-Банк ▫️Диффузионные модели как внутренний инструмент создания контента. Елена Шевченко, Tech Lead, CV, Т-Банк С других потоков будем публиковать постепенно и делиться ссылками с вами здесь.

Другие посты @everydaycv