⚡️Проект ARC запустил ARC-AGI-3 — бенчмарк нового поколения. — @Futuris

1.2Kпросмотров

24.0%от подписчиков

25 марта 2026 г.

📷 ФотоScore: 1.3K

⚡️Проект ARC запустил ARC-AGI-3 — бенчмарк нового поколения. Его цель — проверить не заученную базу знаний, а реальную способность ИИ мыслить, обучаться и адаптироваться в неизвестных условиях. Вместо привычных текстовых задач разработчики с нуля создали 135 уникальных мини-игр. Нейросеть бросают в них вообще без каких-либо правил и инструкций. Чтобы победить, ИИ-агент должен действовать как настоящий игрок при первом прохождении сложной игры: Самостоятельно исследовать незнакомую среду Выдвигать и проверять гипотезы о том, как тут всё работает Планировать шаги вперед и учиться на своих ошибках Что показали первые тесты? Современные ИИ (включая топовые модели) пока справляются откровенно плохо. Они путают новые механики с уже знакомыми задачами, упрямо цепляются за первые ошибочные стратегии и не умеют прогнозировать будущее. В то же время люди не пытаются перебрать все варианты, а быстро строят в голове логическую модель игры и находят решение. Разрыв между человеческим и искусственным интеллектом в плане адаптивности всё еще огромен. Организаторы бросают вызов сообществу: можно попытаться пройти эти игры вручную или разработать собственного ИИ-агента, способного их раскусить. На кону — 2 миллиона долларов в трех номинациях💰💰 https://arcprize.org/arc-agi/3 Интересно, как быстро этот бенч будет побеждён?🌚

Другие посты @Futuris