424просмотров
26.2%от подписчиков
24 марта 2026 г.
stats📷 ФотоScore: 466
🏃♂️ GigaChat 3.1 Ultra & Lightning: большое обновление открытых моделей В ноябре мы открыли preview-версии GigaChat 3 Ultra и Lightning. С тех пор серьёзно доработали и модели, и весь пайплайн — высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1. Сегодня выпускаем обновлённые GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! GigaChat 3.1 Ultra
🔘 702B параметров (36B активных на токен)
🔘 По нашим замерам обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning
🔘 Существенный прирост качества по сравнению с ноябрьским preview — как в метриках, так и в реальных диалогах
🔘 Контекст 131K токенов
➡️ GitVerse | HuggingFace GigaChat 3.1 Lightning
🔘 10B параметров (1.8B активных)
🔘 На аренах отвечает на уровне GPT-4o
🔘 Остаётся одной из лучших моделей в своём размере, особенно сильна в function calling
🔘 Серьёзный выигрыш по скорости за счёт MoE + MTP + FP8
🔘 Контекст 256K токенов
➡️ GitVerse | HuggingFace Обе модели
• Обучены с нуля — без инициализации зарубежными весами
• MoE + MTP + MLA
• Совместимы с HuggingFace, vLLM / SGLang Для нас это не просто апдейт весов — это история про то, как переход на новую архитектуру вскрывает неожиданные проблемы на всех уровнях стека, от данных до инфраструктуры. 🤖 Подробнее — в статье на Habr