W
whargarbl
@whargarbl639 подп.
218просмотров
34.1%от подписчиков
26 марта 2026 г.
📷 ФотоScore: 240
Короче, мой кленовый оптимизатор раздолбал модель в хлам https://github.com/recoilme/muon_adamw8bit Дело возможно в том, что если гптшки состоят из 2д матриц, то в диффузии полно сверток GLM сказал вообще не проблема, выпрямил матрички и поначалу трейн шел неплохо - гораздо бодрее Но в какой то момент сперва начали двоиться объекты, потом лосс начал незначительно расти Не придал этому значения и продолжил трейн. Кончилось всё тем что модель растренилась и трениться назад, кажется не собиралась (рисунок 2). Пришлось набрать на цифры adamw8bit. К счастью он оперативно подскочили и поправил всё (рисунок 1), ну или почти всё (рисунок 5). Такой день.
218
просмотров
659
символов
Нет
эмодзи
Да
медиа

Другие посты @whargarbl

Все посты канала →
Короче, мой кленовый оптимизатор раздолбал модель в хлам htt — @whargarbl | PostSniper