2.5Kпросмотров
71.6%от подписчиков
30 апреля 2025 г.
stats📷 ФотоScore: 2.8K
II-Thought-RL-v0 — датасет для RL с 340 тысячами задач, решающий проблемы старых наборов данных, такие как дублирование и низкое качество. Он включает верификацию и фильтрацию для повышения точности, но имеет дисбаланс, с преобладанием математики и программирования. https://www.ii.inc/web/blog/post/ii-thought