F
Futuris
@Futuris5.0K подп.
1.2Kпросмотров
24.0%от подписчиков
25 марта 2026 г.
📷 ФотоScore: 1.3K
⚡️Проект ARC запустил ARC-AGI-3 — бенчмарк нового поколения. Его цель — проверить не заученную базу знаний, а реальную способность ИИ мыслить, обучаться и адаптироваться в неизвестных условиях. Вместо привычных текстовых задач разработчики с нуля создали 135 уникальных мини-игр. Нейросеть бросают в них вообще без каких-либо правил и инструкций. Чтобы победить, ИИ-агент должен действовать как настоящий игрок при первом прохождении сложной игры: Самостоятельно исследовать незнакомую среду Выдвигать и проверять гипотезы о том, как тут всё работает Планировать шаги вперед и учиться на своих ошибках Что показали первые тесты? Современные ИИ (включая топовые модели) пока справляются откровенно плохо. Они путают новые механики с уже знакомыми задачами, упрямо цепляются за первые ошибочные стратегии и не умеют прогнозировать будущее. В то же время люди не пытаются перебрать все варианты, а быстро строят в голове логическую модель игры и находят решение. Разрыв между человеческим и искусственным интеллектом в плане адаптивности всё еще огромен. Организаторы бросают вызов сообществу: можно попытаться пройти эти игры вручную или разработать собственного ИИ-агента, способного их раскусить. На кону — 2 миллиона долларов в трех номинациях💰💰 https://arcprize.org/arc-agi/3 Интересно, как быстро этот бенч будет побеждён?🌚
1.2K
просмотров
1334
символов
Нет
эмодзи
Да
медиа

Другие посты @Futuris

Все посты канала →
⚡️Проект ARC запустил ARC-AGI-3 — бенчмарк нового поколения. — @Futuris | PostSniper