1.3Kпросмотров
13 ноября 2025 г.
🎬 ВидеоScore: 1.4K
Вышел из микро-отпуска и сразу же Veo подогнали очень интересную фичу — Camera control. Суть в том, что одной кнопкой вы можете менять углы камеры или делать Dolly. И самое клевое — это можно делать на УЖЕ СГЕНЕРЕННЫХ ШОТАХ. То есть вы делаете генерацию, а затем делаете имитацию подсъемки с другой камеры или какой-нибудь небольшой пролет. Почему мне так зашла эта фича? Да все очень просто. В видео-моделях помимо ограничения по токенам в промпте нужно держать во внимании ограничения самой технологии, связанные с одновременными движениями/взаимодействиями объектов в кадре и прочих неприятных особенностях диффузии, о которых я неоднократно писал. Так вот, эта фича позволяет разгрузить модель и не описывать специфические углы, зумы и прочие элементы, сосредоточившись не на движении камеры, а на качестве самой генерации: композиции, взаимодействиях, наполнении сцены, эмоциях и т. д. Потом просто нажать пару кнопок и добавить более интересные углы и пролеты. Но, естественно, и тут есть нюансы и свои ограничения — об этом расскажу в следующих постах. Пока что это стабильно работает только на определенном относительно статичном контенте. И пока Сора захламляет все вокруг контентом плохого качества, аки желтые картинки из ChatGPT (что не отменяет крутость Соры в плане генерации разных сцен за разок, ценой кипения), гуглы просто тихо добавляют элементы контроля, не зависящие от промпта. Это очень круто. ControlNet, так-то, появился по тем же причинам. Необходимы были алгоритмы управления генерациями, идущие как дополнительный элемент контроля при денойзинге. Препроцессоры стали спасением. И гуглы идут по этому же пути.