Всем привет!🔥 📆Сегодня (21 марта) в 16:00 Татьяна Земскова — @embodied_ai_rc

1.9Kпросмотров

21 марта 2025 г.

📷 ФотоScore: 2.1K

Всем привет!🔥 📆Сегодня (21 марта) в 16:00 Татьяна Земскова и Алексей Староверов расскажут про Дообучение VLA с помощью обучения с подкреплением В основе VLA (Vision-Language-Action) модели обычно лежит LLM/LVLM, которая дообучается на заранее собранных наборах данных с помощью обучения с учителем. Дальнейшее дообучение VLA в среде с помощью обучения с подкреплением представляет интерес, т.к. позволило бы повысить устойчивость модели к новым средам. На встрече обсудим, какие особенности имеют VLA при дообучении в среде с помощью RL и рассмотрим методы iRe-VLA и PA-RL, позволяющие повысить устойчивость обучения с подкреплением в среде для VLA Статьи: 1. Improving Vision-Language-Action Model with Online Reinforcement Learning 2. Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone 🍿Ссылка на подключение Подписаться⤵️ Embodied AI Reading Club

Другие посты @embodied_ai_rc