71просмотров
91.0%от подписчиков
6 февраля 2026 г.
📷 ФотоScore: 78
OpenAI против Anthropic: вчера мир ИИ официально перешел в эру автономных агентов! Вчера индустрия ИИ изменилась бесповоротно: мы официально переходим от чат-ботов к автономным агентам. Лидеры рынка, Anthropic и OpenAI, устроили настоящий баттл, выпустив свои мощнейшие модели для кодинга, Claude Opus 4.6 и GPT-5.3-Codex практически одновременно. Это уже не просто умные собеседники, а полноценные «цифровые сотрудники», способные работать часами без участия кожанных мешков человека. Claude Opus 4.6: новый фаворит разработчиков Anthropic представили модель, которая установила рекорд в тесте SWE-bench (82,7%). Она понимает код на уровне топовых инженеров. Главные фишки: ⏺️Огромная память: контекст в 1 млн токенов позволяет загружать целые репозитории или годовые отчеты целиком. ⏺️Адаптивное мышление: модель сама решает, когда нужно взять паузу и «подумать» над сложной логикой, а когда ответить моментально. ⏺️Работа с документами: теперь Claude напрямую правит таблицы в Excel и собирает презентации в PowerPoint. ⏺️Логика: в тестах на абстрактное мышление (ARC-AGI 2) модель набирает 68,8%, что сравнимо с возможностями взрослого человека. GPT-5.3-Codex: автономный напарник OpenAI решили сначала выпустить именно агентскую версию, а не обычную GPT-5.3. Основной упор сделан на то, чтобы нейронка сама управляла процессами в вашей системе. Что она умеет: ⏺️Сессии до 7 часов: ИИ может вести длинный проект несколько часов подряд, сам планирует этапы и пользуется инструментами в Windows, macOS и Linux. ⏺️Сила в терминале: модель показала лучший результат в Terminal Bench (77,3%), что делает её идеальным помощником для админов и бэкенд-разработчиков. ⏺️Поиск уязвимостей: в модель встроили функцию глубокого поиска багов и дыр в безопасности. ⏺️Производительность: всё работает на четверть быстрее предыдущих версий. Что дальше? Пока все тестируют новинки, индустрия ждет 17 февраля. На Лунный Новый год ожидается выход китайской DeepSeek V4. Ходят слухи о том, что новая архитектура памяти позволит китайцам сбросить цены на кодинг-модели в 10 раз. Но и Google тоже вряд ли промолчит, ответ в виде Gemini 3.5 Pro может появиться в ближайшие дни. Эра простых переписок с ИИ закончилась. Теперь нейросеть, это коллега, которому можно делегировать реальные задачи. Где тестировать: Claude: claude.ai OpenAI Codex: openai.com/codex #OpenAI #Anthropic #Claude #GPT5 #DeepSeek #Gemini #Нейросети
71
просмотров
2413
символов
Нет
эмодзи
Да
медиа

Другие посты @bmlabs_ru

Все посты канала →
OpenAI против Anthropic: вчера мир ИИ официально перешел в э — @bmlabs_ru | PostSniper