704просмотров
12 февраля 2026 г.
stats📷 ФотоScore: 774
GLM-5 Новая модель от китайского стартапа Z.AI. Краткий обзор: - MoE с высокой разряженностью 744B-A40B. - Обучена на 28.5T токенах. - Использует архитектуру Deepseek с нативной DSA (Deepseek Sparse Attention), которая существенно снижает цену инференса на длинных контекстах. - По бенчмаркам на уровне или лучше моделей от OpenAI, Anthropic и Google. - Веса выложены под лицензией MIT. Блогпост, веса.