M
Machinelearning
@ai_machinelearning_big_data322.7K подп.
27.0Kпросмотров
8.4%от подписчиков
16 апреля 2026 г.
stats📷 ФотоScore: 29.7K
⚡️ Qwen3.6-35B-A3B - ставка на эффективную архитектуру, а не на размер 35B параметров, ~3B активных за счёт MoE. Главное: - по agentic coding показывает уровень моделей с ~10x большим активным объёмом - превосходит Qwen3.5-27B (dense) и предыдущую Qwen3.5-35B-A3B - нативно мультимодальная архитектура (text + vision) - в VLM-бенчмарках сопоставима с Claude Sonnet 4.5, в ряде задач выше - сильные метрики в задачах spatial reasoning MMMU - 81.7 vs 79.6 MMMU-Pro - 75.3 vs 68.4 MathVista - 86.4 vs 79.8 RealWorldQA - 85.3 vs 70.3. Практическое значение: - MoE даёт кратное снижение compute без потери качества - подходит для агентных сценариев, где важны последовательные действия и планирование - можно использовать как единый стек для code + vision задач Apache 2.0 - без ограничений для продакшена qwen.ai/blog?id=qwen3.6-35b-a3b chat.qwen.ai huggingface.co/Qwen/Qwen3.6-35B-A3B modelscope.cn/models/Qwen/Qwen3.6-35B-A3B @ai_machinelearning_big_data
27.0K
просмотров
985
символов
Нет
эмодзи
Да
медиа

Другие посты @ai_machinelearning_big_data

Все посты канала →