D
Data Blog
@jdata_blog1.6K подп.
1.1Kпросмотров
65.6%от подписчиков
1 января 2026 г.
Score: 1.2K
Вот тебе и замыленный взгляд — бескультурно пропустила классный релиз в конце декабря. DeepMind выпустили Gemma-Scope2, то есть: 1. Выпустили SAE 16/32k, cross-coders и transcoders под модели gemma3-**B (от 270M to 27B) — в общем, для всех. 2. Привезли circuits для всех этих моделей (которые можно посмотреть и поизучать тут) Из примечательного — добавили SAE, cross-coders и transcoders и для instruct моделей (для gemma2 они тоже были, но теперь выбор по размеру модели побольше). В отличие от первой версии — даже для маленьких моделей релизнуты кодеры не со всех слоёв. Но начала-середины и конца, как правило, достаточно для сильных паттернов. [Блогпост], [основной Hf репозиторий и туториалы].
1.1K
просмотров
714
символов
Нет
эмодзи
Нет
медиа

Другие посты @jdata_blog

Все посты канала →
Вот тебе и замыленный взгляд — бескультурно пропустила класс — @jdata_blog | PostSniper