⚡️ Анализируем исследование OpenRouter, вышедшее в декабре 2 — @llm_arena

2.8Kпросмотров

19 января 2026 г.

Score: 3.0K

⚡️ Анализируем исследование OpenRouter, вышедшее в декабре 2025 года. В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, данные до ноября 2025 года). 1. После выхода OpenAI o1 (декабрь 2024) индустрия дружно подсела на multi-step reasoning — думать “в несколько шагов” стало базовой потребностью. • Reasoning-модели уже >50% всего трафика. • xAI Grok Code Fast 1 вырвался на #1 по токенам в reasoning, обогнав Gemini 2.5 Pro и Flash. Хотя есть некий скепсис и впечатление, что цифры у Grok искусственно завышенные на OR. 2. Open Source: Китай + “средний класс” моделей • DeepSeek + Qwen выросли с микродолей до примерно ~30% мирового объема токенов. • И главное: OS перестал быть «одна семья правит всеми». Раньше тянул DeepSeek, теперь трафик размазан между DeepSeek / Qwen / Moonshot (Kimi) / GPT-OSS. • Маленькие модели <15B в API теряют смысл и популярность. Побеждает “средний класс” 15B–70B — новый стандарт эффективности. 3. Кодинг — наконец-то серьезный рост • Доля запросов по программированию выросла с 11% до ~50% всего объема токенов к концу 2025. • Anthropic всё ещё король кодинга: Claude держит ~60% рынка платных код-запросов. Но OpenAI и MiniMax уже начали подъедать доли. (Хотя сами мы тут ставим и на Гемини, который на том же OR уже не первую неделю лидирует в «Программировании»). • Кодинг — главная причина роста длины промптов. Контексты в коде в среднем в 3–4 раза длиннее, чем «обычные» задачи. 4. Roleplay — скрытый потенциал. В мире Open Source 52% всех токенов тратится на... Ролплей. • Люди используют открытые модели для создания персонажей и интерактивных историй, так как там меньше цензуры. • Даже в китайских моделях ролплей занимает треть трафика, хотя там растет доля кодинга. 5. Эффект «Стеклянной туфельки» (The Glass Slipper Effect) Авторы ввели крутой термин для удержания пользователей. • Если модель первой «идеально решает» специфическую задачу юзера (надевается как туфелька Золушки), этот юзер остается с ней навсегда, даже если выходят модели новее. • У DeepSeek обнаружен уникальный «Эффект бумеранга»: пользователи уходят пробовать новинки, но возвращаются обратно, поняв, что соотношение цена/качество у DeepSeek лучше. 6. Цена vs Качество Рынок разделился на два лагеря: • Efficient Giants: Дешево и много (Gemini Flash, DeepSeek). Здесь царствует закон Джевонса — снижение цены ведет к взрывному росту потребления. • Premium Leaders: Дорого и качественно (Claude 3.7/4 Sonnet, GPT-5 Pro). Спрос здесь неэластичен: профи готовы платить любые деньги за топовое качество рассуждений.

Другие посты @llm_arena