395просмотров
18.3%от подписчиков
30 марта 2026 г.
📷 ФотоScore: 435
сегодня я хочу рассказать про нашу статью Call, Reward, Repeat: Advancing Dialog State Tracking with GRPO and Function Calling; благо есть повод - на EACL SRW она получила награду Outstanding paper суть работы довольно простая, но сначала надо сделать отступление и рассказать про саму задачу DST - Dialogue State Tracking; идея в том, что при общении с пользователем диалоговая система должна хранить полученные данные, чтобы выполнить потребность пользователя (1 картинка) еще до нас придумали, что это можно сделать с помощью LLM и function calling; наша инновация заключается в применении к этому процессу GRPO, что позволяет добиваться хороших результатов при небольшом объеме данных, которые для диалогов всегда были проблемой (2 и 3 картинки) пользуясь случаем, хочу поздравить своих соавторов - Тимура и Аню #моистатьи @valuableai
395
просмотров
842
символов
Нет
эмодзи
Да
медиа

Другие посты @valuableai

Все посты канала →
сегодня я хочу рассказать про нашу статью Call, Reward, Repe — @valuableai | PostSniper