2.0Kпросмотров
29 апреля 2025 г.
📷 ФотоScore: 2.2K
YAML vs JSON: Улучшаем результаты Function calling для LLM Ex. рисерчер из Meta обучал LLM для вызова внешних функций и заметил интересный эффект: при использовании JSON модель быстро теряла разнообразие идей из-за строгого синтаксиса (например, кавычки и запятые). Это приводило к entropy collapse — модели становились слишком "зажатыми". В качестве решения он предложил перейти на YAML: 🔵Модель тратит меньше усилий на синтаксис, больше — на содержание (в примере: 64 символа в JSON → 44 в YAML).
🔵Разброс энтропии (зелёная кривая на графике) стабилизировался и средняя энтропия выросла → выросло итоговое качество
🔵В результате повысилось разнообразие идей и улучшилось качество генерации. 📎 Для работы с YAML на Python можно использовать простой pyyaml 📎 Для крупных моделей типа Claude проблема тоже актуальна.