1.2Kпросмотров
13 октября 2025 г.
📷 ФотоScore: 1.4K
Последние несколько недель я активно использую Wan 2.5 в работе и мне она дико доставляет. По качеству движений до Veo3 или Sora2 не дотягивает, но это лютый прорыв в сегменте опенсорс моделей (хотя пока она не опенсорс, но скоро должна им стать). Причем, использую я ее не столько для генерации видео, сколько для генерации консистентных кадров, которые затем использую в других генераторах. Что-то вроде нанобананы, только интереснее. Щас поясню. На примерах один кейфрейм (генка из MJ), остальное — сырые скриншоты без обработки или апскейла. У нее есть ряд неочевидных преимуществ, которые стоит прощупать один раз и отказаться от них уже тяжело. Например:
— у нее практически отсутствует деградация цвета при оживлении кадра;
— из-за нативной поддержки 1080p кейфрейм не шакалится и при правильной работе промежуточные кадры настолько схожи по качеству с первым, что скрины из видео можно использовать как кейфреймы в других генераторах; — из-за особенностей работы видеомоделей, при смене ракурсов освещение остается более консистентным, чем в 2d in-context моделях;
— окружение более логичное при смещении ракурсов (видно на примере с креплением сетки на заднем фоне);
— вместе предыдущие пункты дают очень крутой результат при использовании скринов в других генераторах; А нафига так сложно, если можно просто сгенерить другой ракурс в нано банане? При генерации различных ракурсов в in-context моделях велика вероятность появления дрейфа в цветах и искажения деталей/геометрии объектов/персонажей при изменении их положения в пространстве, т.к. эти модели все еще работают в двух измерениях. Ну вот так работает технология, ничего не поделаешь. Само собой, речь тут идет в первую очередь о работе с качеством финального материала. Тем, кого в контексте работы устраивают кипящие генерации из Соры, все это не нужно. Да и мне это не всегда нужно, так-то. Но если вдруг нужно выжать максимум качества, внезапно, знания таких нюансов ппц как выручают. Когда вы понимаете, что скрины из сгенеренного видоса можно спокойно использовать на уровне с генерациями той же Midjourney и их будет достаточно тяжело отличить друг от друга по качеству - это открывает очень много возможностей для работы с задачами разных уровней сложности. Мутный AI - Волшебных кнопок нет, есть только инструменты.