7просмотров
13.0%от подписчиков
24 марта 2026 г.
📷 ФотоScore: 8
🔬 Экспертные персоны для LLM: палка о двух концах Новое исследование раскрывает механизм экспертных персон. Вывод: персоны улучшают одни задачи, но гарантированно ухудшают другие. 📉 Где вредят?
- Точность знаний (MMLU): падение с 71.6% до 68.0%
- Математика, кодинг: ухудшение до -0.65 балла 📈 Где помогают?
- Стиль, формат: извлечение данных (+0.65), STEM (+0.60)
- Безопасность: отказ от вредных запросов до +17.7% 💡 Ключевые факты:
1. Длинные персоны сильнее помогают в «alignment», но сильнее вредят точности
2. Модели, чувствительные к системным промптам (Llama), получают больше пользы и вреда
3. У «рассуждающих» моделей (R1) персона улучшает только задачи из обучения, стирая безопасность 🛠 Решение PRISM: бинарный маршрутизатор включает персону только где полезно. Результат: Qwen2.5-7B поднял общую производительность с 71.8 до 73.5 без потери точности MMLU. 🔗 https://arxiv.org/abs/2603.18507 #AI #Исследования