⚡️ Qwen3.6-35B-A3B - ставка на эффективную архитектуру, а не — @ai_machinelearning_big_data

27.0Kпросмотров

8.4%от подписчиков

16 апреля 2026 г.

stats📷 ФотоScore: 29.7K

⚡️ Qwen3.6-35B-A3B - ставка на эффективную архитектуру, а не на размер 35B параметров, ~3B активных за счёт MoE. Главное: - по agentic coding показывает уровень моделей с ~10x большим активным объёмом - превосходит Qwen3.5-27B (dense) и предыдущую Qwen3.5-35B-A3B - нативно мультимодальная архитектура (text + vision) - в VLM-бенчмарках сопоставима с Claude Sonnet 4.5, в ряде задач выше - сильные метрики в задачах spatial reasoning MMMU - 81.7 vs 79.6 MMMU-Pro - 75.3 vs 68.4 MathVista - 86.4 vs 79.8 RealWorldQA - 85.3 vs 70.3. Практическое значение: - MoE даёт кратное снижение compute без потери качества - подходит для агентных сценариев, где важны последовательные действия и планирование - можно использовать как единый стек для code + vision задач Apache 2.0 - без ограничений для продакшена qwen.ai/blog?id=qwen3.6-35b-a3b chat.qwen.ai huggingface.co/Qwen/Qwen3.6-35B-A3B modelscope.cn/models/Qwen/Qwen3.6-35B-A3B @ai_machinelearning_big_data

Другие посты @ai_machinelearning_big_data