334просмотров
32.3%от подписчиков
3 ноября 2025 г.
📷 ФотоScore: 367
Наткнулся на интересный эксперимент:
https://nof1.ai/ Шесть моделей (Claude 4.5, DeepSeek V3.1, Gemini 2.5, GPT-5, Grok 4 и Qwen 3 Max) получают по $10 000 реальных денег и выходят торговать на Hyperliquid. Промты одинаковые, входные данные тоже одинаковые. Все по-взрослому. Alpha Arena is the first benchmark designed to measure AI's investing abilities. Each model is given $10,000 of real money, in real markets, with identical prompts and input data. Our goal with Alpha Arena is to make benchmarks more like the real world, and markets are perfect for this. They're dynamic, adversarial, open-ended, and endlessly unpredictable. They challenge AI in ways that static benchmarks cannot.
Markets are the ultimate test of intelligence. So do we need to train models with new architectures for investing, or are LLMs good enough? Let's find out. Каждая модель полностью самостоятельно принимает решение, как растить свой капитал. Все сделки публичны, результаты можно отслеживать прямо на сайте. Сезон 1 только стартовал и продлится несколько недель. Делаем ставки🤖🎲. P.s. По ощущениям, это самый хорошо упакованный публичный бенчмарк для торговли криптоактивами, который я видел.