K
Klon_ai
@Klon_ai103 подп.
78просмотров
75.7%от подписчиков
9 октября 2025 г.
📷 ФотоScore: 86
🧠 HuMo - новая эпоха человеко-ориентированного видео ByteDance и Tsinghua University выкатили HuMo - систему, создающую реалистичные видео, где в центре внимания человек. Модель объединяет три источника - текст, изображение и аудио - чтобы генерировать ролики с синхронизированной мимикой, движениями и голосом. HuMo обучен через collaborative multi-modal learning - это значит, что нейросеть одновременно «учится» понимать текст, видеть изображение и слышать звук, а затем объединяет их в согласованное видео. Отдельный модуль time-adaptive guidance позволяет модели фокусироваться на нужной модальности в разные моменты генерации - например, уделять больше внимания голосу при произнесении реплики. Проект уже выложен в открытый доступ на GitHub: 👉 github.com/Phantom-video/HuMo 💭#HuMo | #AIvideo | #ИИ | #Нейросети
78
просмотров
821
символов
Да
эмодзи
Да
медиа

Другие посты @Klon_ai

Все посты канала →
🧠 HuMo - новая эпоха человеко-ориентированного видео ByteDa — @Klon_ai | PostSniper