617просмотров
9.0%от подписчиков
22 марта 2026 г.
stats📷 ФотоScore: 679
🌐 Droplet3D — генерация 3D из видео и текста ℹ️ Droplet3D — новый генеративный 3D-модельный фреймворк, который учится на огромном видео-датасете Droplet3D-4M с четырьмя миллионами 3D-объектов и плотными текстовыми описаниями вида под разными углами. Суть идеи: использовать видео как источник пространственной информации и "commonsense priors" — движения камер и объектов дают естественные ориентиры для создания реалистичных 3D-форм. 📌 Модель поддерживает вход как в виде текста, так и в виде изображения, выравнивает перспективу входного вида, генерирует мультивью siri surround-view изображения (85 кадров 360°) и из этого строит либо Gaussian splatting 3D-сцену, либо текстурированную сетку — всё в open-source. 🔗 Все компоненты открыты: датасет, код, архитектура и веса модели доступны на Hugging Face, GitHub и сайте проекта.