984просмотров
2 апреля 2025 г.
statsScore: 1.1K
В этот четверг 3 апреля послушаем два доклада: 1️⃣ Илья Белецкий расскажет про работу LIGHTNING-FAST IMAGE INVERSION AND EDITING FOR TEXT-TO-IMAGE DIFFUSION MODELS. В прикладных областях генеративного моделирования часто возникает необходимость в процедуре инверсии - получении латентного представления исходного изображения в пространстве модели. В диффузионных моделях наиболее популярный бейзлайн для получения инверсии - DDIM подход, который содержит в себе аппроксимацию, не являющуюся критичной из-за большого количества шагов генерации и их достаточно близкого расположения на траектории сэмплирования. Иначе ситуация обстоит у малошаговых методов, где отдельные шаги расположены достаточно далеко друг от друга, а аналогичная аппроксимация становится довольно грубой. Авторы предлагают метод повышения качества инверсии для малошаговых методов, который масштабируется на различные диффузионные модели, а также позволяет достичь высоких метрик в задаче редактирования. 2️⃣ Сергей Карпухин разберёт две работы ControlNet-XS и CtrLoRA - в первой рассматривается редизайн архитектуры классического ControlNet, а во второй изучается фреймворк для предобучения и дешевой адаптации ControlNet к новым доменам. Ссылку на зум пришлем перед встречей!