W
Waiting AGI
@waitingagi54 подп.
7просмотров
13.0%от подписчиков
24 марта 2026 г.
📷 ФотоScore: 8
🔬 Экспертные персоны для LLM: палка о двух концах Новое исследование раскрывает механизм экспертных персон. Вывод: персоны улучшают одни задачи, но гарантированно ухудшают другие. 📉 Где вредят? - Точность знаний (MMLU): падение с 71.6% до 68.0% - Математика, кодинг: ухудшение до -0.65 балла 📈 Где помогают? - Стиль, формат: извлечение данных (+0.65), STEM (+0.60) - Безопасность: отказ от вредных запросов до +17.7% 💡 Ключевые факты: 1. Длинные персоны сильнее помогают в «alignment», но сильнее вредят точности 2. Модели, чувствительные к системным промптам (Llama), получают больше пользы и вреда 3. У «рассуждающих» моделей (R1) персона улучшает только задачи из обучения, стирая безопасность 🛠 Решение PRISM: бинарный маршрутизатор включает персону только где полезно. Результат: Qwen2.5-7B поднял общую производительность с 71.8 до 73.5 без потери точности MMLU. 🔗 https://arxiv.org/abs/2603.18507 #AI #Исследования
7
просмотров
928
символов
Да
эмодзи
Да
медиа

Другие посты @waitingagi

Все посты канала →
🔬 Экспертные персоны для LLM: палка о двух концах Новое исс — @waitingagi | PostSniper