Российский метод GRPO для диалоговых систем обогнал GPT-4 пр — @laborant_news

44просмотров

6.5%от подписчиков

28 марта 2026 г.

📷 ФотоScore: 48

Российский метод GRPO для диалоговых систем обогнал GPT-4 при 4x меньших параметрах Похоже, кто-то решил показать, что размер не всегда имеет значение. Команда из MWS AI (MTS Web Services), Университета ИТМО и IITU представила на EACL 2026 метод обучения диалоговых ботов, который переворачивает индустрию с ног на голову. Вместо традиционного «покажи модели правильный ответ» они дали ей возможность самой находить решения через обучение с подкреплением GRPO. Результаты впечатляют: модель на 8 млрд параметров показала точность 41,9%, превзойдя GPT-4 с её 38,7%, и более крупную модель на 32 млрд параметров. Ключевая фишка — система не теряет контекст разговора и отвечает по делу, а не мимо запроса. Бонусом идёт возможность обучения на данных из других доменов, весь процесс укладывается в одну GPU, а код открыт на GitHub. Метки: 🇷🇺 🟨 ⚡️ Вердикт Лаборатории: Когда российские разработчики доказывают, что интеллект важнее грубой силы — приятное исключение из правил.

Другие посты @laborant_news