М
Мутный AI
@mutniy_ai829 подп.
1.3Kпросмотров
11 сентября 2025 г.
📷 ФотоScore: 1.4K
Вы, вероятно видели посты о том, что Nano Banana может совмещать по 10+ предметов в одной генерации, да так хорошо прям, ух! Не, реально круто, без шуток. Но, кажется, есть нюанс. А что, если я скажу, что возможно, перед генерацией в Gemini объекты с разных референсов коллажируются определенным образом, и только потом подается на вход диффузионной модели? Что-то вроде Image Stitch в ComfyUI. Какое-то время мне был не совсем понятен ряд моментов: - почему она так хорошо сохраняет объекты в таких количествах; - почему без упоминания нумерации изображений результаты лучше; - почему иногда она выдает вместо результата ту же самую пикчу без изменений и прочие неприятные нюансы работы с ней. Но все стало логично, когда из-за перегруза модель выплюнула мне "генерацию", на которым она не стала ничего генерить, оставив сырой результат сшивания референсов. При попытке это повторить, Gemini скрывала результаты генерации, но говорила, что все готово. Что интересно, во Flux и Qwen я ни разу не сталкивался с таким, но знаю, что Image Stitch иногда используют в WF с Flux'oм. Есть ощущение, что гугловцы так расширили количество поддерживаемых на входе референсов, чтобы казалось, что их модель сильно круче конкурентов. Полноценно подтвердить я это не могу, т.к. их документация по этому поводу весьма туманна (как и об огромной части датасета Veo3, хотя все всё прекрасно понимают). Если вы хотите научиться уверенно работать с генеративными моделями, нужно не только стрелять из интернета успешные промпты или практики, важно уметь набивать шишки. Это очень важный навык, он позволяет лучше понимать работу моделей и быстро адаптироваться к новому. Вы должны обращать внимание не только на позитивные результаты, но и на негативные, которые в успешных успехах не принято показывать, а жаль. Если генерация не удалась, можно проанализировать результат и понять, почему так произошло. А при более вдумчивом подходе, можно прощупать допуски модели, ее настоящее окно контекста и прочие нюансы. Мутный AI - Волшебных кнопок нет, есть только инструменты.
1.3K
просмотров
2076
символов
Нет
эмодзи
Да
медиа

Другие посты @mutniy_ai

Все посты канала →
Вы, вероятно видели посты о том, что Nano Banana может совме — @mutniy_ai | PostSniper