1.1Kпросмотров
29 января 2026 г.
📷 ФотоScore: 1.2K
Только не показывайте такие результаты менеджерам, иначе они поставят KPI +∞ к вашей бизнес-метрике после внедрения AI-агентов 😬 Что здесь происходит? На скриншоте мой Claude-агент отчитывается о проделанном рефакторинге.
Сейчас я экспериментирую с моделями до 2B параметров на задачах RAG и изучаю влияние разных мультиагентных архитектур на качество ответов. Для тестов использую проработанный бенчмарк HotpotQA В этот раз агент исправил баг и искренне обрадовался, когда метрика выросла в бесконечность раз 📈