Э
эйай ньюз
@ai_newz92.2K подп.
28.7Kпросмотров
31.1%от подписчиков
14 апреля 2026 г.
📷 ФотоScore: 31.6K
ERNIE Image — новый открытый text2image генератор от Baidu Довольно компактная 8B моделька довольно успешно соревнуется с заметно большим Qwen Image на бенчах, а также обходит Z-image по бенчам. УДИВИТЕЛЬНО хорошо рендерит текст, для своего размера и разрешения (1MP). Архитектурно это single stream MM-DiT. ERNIE Image кидает токены текста и патчи изображения в один общий трансформер с самого начала — никаких параллельных веток (как у Flux), все веса общие. Это проще и компактнее, при этом качество сопоставимое. Архитектурно похоже на Z-image, но проще. Из интересных нюансов — авторы затюнили 3B LLM для перефразирования промптов юзеров, что заметно улучшает результаты, но модель можно запускать и без него. Вместе с обычными весами выпускают Turbo версию, которой нужно всего 8 шагов для генерации. Модель запускается на 24GB VRAM, ещё и веса под Apache 2.0 (делать можно что угодно). Го тестить, я уже поднял ее на своей H200 и модель действительно хороша! На H200 из коробки 8 шагов генерит за 11 сек. Демо Блогпост Веса Код @ai_newz
28.7K
просмотров
1054
символов
Нет
эмодзи
Да
медиа

Другие посты @ai_newz

Все посты канала →
ERNIE Image — новый открытый text2image генератор от Baidu Д — @ai_newz | PostSniper