E
EFEMERA: AI news
@EF9MERA1.6K подп.
424просмотров
26.2%от подписчиков
24 марта 2026 г.
stats📷 ФотоScore: 466
🏃‍♂️ GigaChat 3.1 Ultra & Lightning: большое обновление открытых моделей В ноябре мы открыли preview-версии GigaChat 3 Ultra и Lightning. С тех пор серьёзно доработали и модели, и весь пайплайн — высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1. Сегодня выпускаем обновлённые GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! GigaChat 3.1 Ultra 🔘 702B параметров (36B активных на токен) 🔘 По нашим замерам обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning 🔘 Существенный прирост качества по сравнению с ноябрьским preview — как в метриках, так и в реальных диалогах 🔘 Контекст 131K токенов ➡️ GitVerse | HuggingFace GigaChat 3.1 Lightning 🔘 10B параметров (1.8B активных) 🔘 На аренах отвечает на уровне GPT-4o 🔘 Остаётся одной из лучших моделей в своём размере, особенно сильна в function calling 🔘 Серьёзный выигрыш по скорости за счёт MoE + MTP + FP8 🔘 Контекст 256K токенов ➡️ GitVerse | HuggingFace Обе модели • Обучены с нуля — без инициализации зарубежными весами • MoE + MTP + MLA • Совместимы с HuggingFace, vLLM / SGLang Для нас это не просто апдейт весов — это история про то, как переход на новую архитектуру вскрывает неожиданные проблемы на всех уровнях стека, от данных до инфраструктуры. 🤖 Подробнее — в статье на Habr
424
просмотров
1412
символов
Да
эмодзи
Да
медиа

Другие посты @EF9MERA

Все посты канала →
🏃‍♂️ GigaChat 3.1 Ultra & Lightning: большое обновление отк — @EF9MERA | PostSniper