Делаем LoRA из одного изображения 🖼 Вышла Qwen-Image-i2L от — @txt2vid

1.3Kпросмотров

52.5%от подписчиков

24 декабря 2025 г.

📷 ФотоScore: 1.4K

Делаем LoRA из одного изображения 🖼 Вышла Qwen-Image-i2L от Alibaba, которая умеет создавать готовую LoRA, обученную на одном изображении. Подобных решений раньше на рынке не было, это не привычный всем IP-адаптер, а полноценный генератор LoRA, который позволяет не тратить часы на тренировку и сбор датасета. Всего четыре версии для разных задач: 🔵 Style 2.4B — идеальна для переноса стиля. Намеренно слабее в деталях, чтобы эффективно извлекать стилистическую информацию 🔵 Coarse 7.9B — основная модель для сохранения контента. Использует несколько энкодеров: SigLIP2, DINOv3, Qwen-VL и лучше сохраняет структуру 🔵 Fine 7.6B — работает в связке с Coarse для максимальной детализации за счет повышения разрешения Qwen-VL энкодера до 1024x1024 🔵 Bias (30M) — корректирующая LoRA, которая приводит изображения к базовому стилю Qwen-Image. Поддерживаются разные разрешения, от 224×224 до 1024×1024. Несмотря на довольно большие размеры моделей, аж до 7.9B параметров, они оптимизированы для запуска на потребительских ПК. Не все части модели хранятся в быстрой части VRAM видеокарты, неактивные веса временно выгружаются на SSD или HDD. Все модели совместимы с DiffSynth-Studio 🔗 Демо 🔗 HuggingFace 🤖 НЕЙРО-СКЛАД — всё, что нужно, для твоей нейронки!

Другие посты @txt2vid