1.1Kпросмотров
10 марта 2026 г.
📷 ФотоScore: 1.2K
В Comfy снова танцевать с арендным GPU, собирать новые пайплайны под z-image, flux и всё остальное мне вообще не хотелось. Решил сначала закрыть для себя более базовый вопрос: темы и промпты. Понятно, что почти все мы для этого используем ChatGPT. Либо просто параллельно в работе, либо вшиваем базовые запросы в свои пайплайны. Но такого контента уже миллионы, и чем дальше, тем сильнее нужно сужаться. А после какого-то количества повторений GPT начинает ходить по кругу, повторяться, забывать, что уже предлагал. Короче, вы и сами всё это знаете. В какой-то момент появилась мысль адаптировать систему матриц, про которую я рассказывал в одном из упражнений в своей обучалке. Чтобы можно было идти не от одного запроса, а от смешивания тем и ассоциативных связок. Пока тестирую такой тип комбинированной матрицы: Тема, Кто/что, Концепт, Визуальный стиль, Цветовая палитра, Ограничения. Если в каждой матрице по 30 пунктов, то это уже 729 млн уникальных комбинаций. Да, часть из них будет мусорной, но тут всё сильно зависит от качества самих матриц. Или можно сделать 1 тему и под неё подобрать остальные пункты, тогда процент хорошего будет сильно выше. Чтобы не было повторов, я сделал базу данных, куда записываются уже использованные комбинации. Дальше схема такая: полученная комбинация уходит в первого ИИ-агента, который переваривает этот набор слов и собирает из него сценарный сюжет. Потом сюжет уходит во второго ИИ-агента, который адаптирует его под правила промптов для Midjourney и делает 4 разных варианта с учётом раскадровки: например, общий план, крупный, вертикальный и так далее. Назвал это приложение Промптогатор3000. Попользовался - и да, пока это выглядит вполне рабочим способом быстро получать практически любое количество промптов, чтобы потом кормить этим Midjourney. Но, естеееееественно: копировать и вставлять всё это руками — безумно скучно. Делать автоматизацию через имитацию кликов, набор текста и прочий UI-маскарад, как я когда-то делал для Visual Electric, довольно плохая идея. После первых капч и подозрений можно сразу готовиться к бану. Официального API у Midjourney по-прежнему нет. Вскоре я наткнулся на неофициальные решения. Формально это не совсем API, но технические детали сейчас опустим. По сути там целая прослойка, которая занимается всей грязной работой: оптимизирует алгоритмы, обходит капчи, выстраивает тайминги, распределяет нагрузку, и туда даже можно подключать несколько MJ-аккаунтов. В общем, не вдаваясь в детали того, как именно я это всё вкрутил в Промптогатор3000, теперь у меня есть помощник, который: -собирает кучу промптов по матрицам; -отправляет их в Midjourney; -использует персонализацию, мудборды и прочее; -скачивает готовые картинки; а я уже только отсматриваю и фильтрую результат. Этот последний этап, к сожалению, пока ещё не нельзя отдавать роботам. По сути получилось сделать автоматизацию уровня Comfy, но с качеством хорошо прирученного под мой вкус Midjourney. Естественно предстоит ещё многое сделать. Новые внезапные идеи и дополнительная полировка, особенно если это приложение будет нужно ещё кому-то кроме меня, но это уже работает и я радуюсь) Посмотрим, к чему это приведёт. В который раз убеждаюсь, что лень - это не слабость, а почти суперсила. Или тотемное животное.
1.1K
просмотров
3286
символов
Нет
эмодзи
Да
медиа

Другие посты @neuromishenin

Все посты канала →
В Comfy снова танцевать с арендным GPU, собирать новые пайпл — @neuromishenin | PostSniper