930просмотров
13 марта 2025 г.
Score: 1.0K
Perplexity через SFT "расцензурили" DeepSeek-R1 🤡 Рецепт: 1) Классификатор проблемных промптов (мультиязычный!)
2) Создание рассуждений в стиле R1 (неужели вручную писали)
3) Оценка человеками расцензуренности и сравнение с другими LLM
4) Также убедились, что нет сильной просадки на бенчах (но небольшая всё равно есть) Столько сил, чтобы про ту самую площадь поспрашивать... 🤦♂️ Заняться людям нечем