347просмотров
27.5%от подписчиков
2 июля 2025 г.
📷 ФотоScore: 382
Вышла третья хорошая открытая Китайская нейронка - MiniMax. Первые две - это Deepseek и Qwen.
456 млрд параметров, MOE архитектура, 46млрд активных параметров. Размер нейронки лежит между Deepseek и Qwen. Отличительная особенность - большой входной контекст в 1 миллион токенов. Скачать веса и узнать больше деталей о модели можно на странице huggingface:
https://huggingface.co/MiniMaxAI/MiniMax-M1-80k