71просмотров
91.0%от подписчиков
6 февраля 2026 г.
📷 ФотоScore: 78
OpenAI против Anthropic: вчера мир ИИ официально перешел в эру автономных агентов! Вчера индустрия ИИ изменилась бесповоротно: мы официально переходим от чат-ботов к автономным агентам. Лидеры рынка, Anthropic и OpenAI, устроили настоящий баттл, выпустив свои мощнейшие модели для кодинга, Claude Opus 4.6 и GPT-5.3-Codex практически одновременно. Это уже не просто умные собеседники, а полноценные «цифровые сотрудники», способные работать часами без участия кожанных мешков человека. Claude Opus 4.6: новый фаворит разработчиков
Anthropic представили модель, которая установила рекорд в тесте SWE-bench (82,7%). Она понимает код на уровне топовых инженеров. Главные фишки:
⏺️Огромная память: контекст в 1 млн токенов позволяет загружать целые репозитории или годовые отчеты целиком.
⏺️Адаптивное мышление: модель сама решает, когда нужно взять паузу и «подумать» над сложной логикой, а когда ответить моментально.
⏺️Работа с документами: теперь Claude напрямую правит таблицы в Excel и собирает презентации в PowerPoint.
⏺️Логика: в тестах на абстрактное мышление (ARC-AGI 2) модель набирает 68,8%, что сравнимо с возможностями взрослого человека. GPT-5.3-Codex: автономный напарник
OpenAI решили сначала выпустить именно агентскую версию, а не обычную GPT-5.3. Основной упор сделан на то, чтобы нейронка сама управляла процессами в вашей системе. Что она умеет:
⏺️Сессии до 7 часов: ИИ может вести длинный проект несколько часов подряд, сам планирует этапы и пользуется инструментами в Windows, macOS и Linux.
⏺️Сила в терминале: модель показала лучший результат в Terminal Bench (77,3%), что делает её идеальным помощником для админов и бэкенд-разработчиков.
⏺️Поиск уязвимостей: в модель встроили функцию глубокого поиска багов и дыр в безопасности.
⏺️Производительность: всё работает на четверть быстрее предыдущих версий.
Что дальше?
Пока все тестируют новинки, индустрия ждет 17 февраля. На Лунный Новый год ожидается выход китайской DeepSeek V4. Ходят слухи о том, что новая архитектура памяти позволит китайцам сбросить цены на кодинг-модели в 10 раз. Но и Google тоже вряд ли промолчит, ответ в виде Gemini 3.5 Pro может появиться в ближайшие дни. Эра простых переписок с ИИ закончилась. Теперь нейросеть, это коллега, которому можно делегировать реальные задачи. Где тестировать: Claude: claude.ai
OpenAI Codex: openai.com/codex #OpenAI #Anthropic #Claude #GPT5 #DeepSeek #Gemini #Нейросети