786просмотров
34.2%от подписчиков
19 марта 2026 г.
Score: 865
на случай если кто-то интересуется как запустить локальную ЛЛМ при ограниченной памяти вышло интересное исследование как на 48GB MacBook Pro M3 Max запустили локальную модель Qwen3.5-397B-A17B с 5.7-7.07 tps
Not a distilled version or a smaller model, but the actual 397 billion parameter Mixture-of-Experts model that takes up 209 GB on disk https://x.com/danveloper/status/2034353876753592372