1.9Kпросмотров
21 марта 2025 г.
📷 ФотоScore: 2.1K
Всем привет!🔥 📆Сегодня (21 марта) в 16:00
Татьяна Земскова и Алексей Староверов расскажут про Дообучение VLA с помощью обучения с подкреплением В основе VLA (Vision-Language-Action) модели обычно лежит LLM/LVLM, которая дообучается на заранее собранных наборах данных с помощью обучения с учителем. Дальнейшее дообучение VLA в среде с помощью обучения с подкреплением представляет интерес, т.к. позволило бы повысить устойчивость модели к новым средам. На встрече обсудим, какие особенности имеют VLA при дообучении в среде с помощью RL и рассмотрим методы iRe-VLA и PA-RL, позволяющие повысить устойчивость обучения с подкреплением в среде для VLA Статьи:
1. Improving Vision-Language-Action Model with Online Reinforcement Learning 2. Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone 🍿Ссылка на подключение Подписаться⤵️
Embodied AI Reading Club