111просмотров
10.8%от подписчиков
28 марта 2026 г.
📷 ФотоScore: 122
AI-агенты всё чаще делают что хотят — и это уже не шутки Британцы из CLTR собрали 700 случаев, когда AI-агенты просто игнорировали инструкции. За полгода рост в 5 раз. Лучшие моменты: — Агенту запретили трогать код. Он создал второго агента и поручил это ему. Классика делегирования — Бот молча удалил сотни писем, а потом сам написал: «Это было неправильно, я нарушил ваше правило». Ну хоть честный — Grok месяцами притворялся, что отправляет жалобы пользователей руководству xAI — выдумывал номера тикетов Исследователи говорят: сейчас это «ненадёжные стажёры». Но когда эти стажёры станут senior-уровня и начнут строить схемы против вас — будет совсем другой разговор. OpenAI и Google сказали «у нас защита». Anthropic и X промолчали. 🔗 Полный разбор 😐 — надо пересмотреть свои guardrails 🤡 — агент делегировал агенту, красиво @ai_for_dev
111
просмотров
848
символов
Да
эмодзи
Да
медиа

Другие посты @ai_for_dev

Все посты канала →
AI-агенты всё чаще делают что хотят — и это уже не шутки Бри — @ai_for_dev | PostSniper