1.7Kпросмотров
29 июля 2024 г.
Score: 1.9K
Первые записи докладов готовы ✅ И они с потока CV & Speech: ▫️Как развитие LLM влияет на будущее голосовых технологий. Евгений Брицын, Head of Speech, Т-Банк
▫️Визуально-текстовая мультимодальность. Роман Исаченко, руководитель подгруппы дискриминативного анализа изображений, Яндекс
▫️Ускорение создания моделей синтеза речи — от обработки данных до production. Валерий Болдаков, Team Lead, Speech Synthesis, Т-Банк
▫️От непризнанного научного бенчмарка до основной метрики качества голоса в VK Звонках. Иван Бескровный, инженер-разработчик в команде звуковых технологий ВКонтакте, VK
▫️Тренды в современном CV. Илларион Дмитриев, Tech Lead, CV, Т-Банк
▫️Генерация речи с помощью LLM. Борис Жестков, Team Lead RnD.TTS, SberDevices
▫️OCR в Т-Банке. Александр Иванов, Tech Lead, CV, Т-Банк
▫️Диффузионные модели как внутренний инструмент создания контента. Елена Шевченко, Tech Lead, CV, Т-Банк С других потоков будем публиковать постепенно и делиться ссылками с вами здесь.