210просмотров
7 ноября 2025 г.
Score: 231
Поскольку у нас из каждого утюга про AI и LLM давайте зафиксируем, чтобы не путать и различать. Что есть AI-агент на уровне концепций и устройства. ❗️Основной тезис:
AI-агент - это дополнительный слой над LLM, который, помимо генерации текста и рассуждений, умеет выполнять действия через инструменты и управлять контекстом. Итак, у нас есть 3 слоя:
1️⃣ LLM (ядро) - это базовая модель (GPT-5, Claude, Gemini и т.д.), которая умеет: -понимать естественный язык, -рассуждать (chain-of-thought), -генерировать текст, код, JSON и т.п. Сама по себе она ничего не делает во внешнем мире, только отдаёт токены в виде валидного контекста 2️⃣ Agent Layer (агентный слой) - это прослойка между LLM и внешней средой, которая:
- предоставляет action space (список возможных действий), -решает, когда и что из этого списка вызвать,
- управляет состоянием и контекстом между шагами,
- проверяет безопасность и исполняет действия. На самом деле, если откинуть красивое слово Agent, то просто Оркестратор и ничего более. Proxy между LLM и внешним миром, который разрешает только строго описанные вызовы.
Ни модель, ни оркестратор не имеют общего CLI-доступа к ОС-хосту (в нормальной ситуации). Когда LLM вызывает что-то вроде "выполни Python-код", оркестратор делает следующее:
1)Создаёт изолированный контейнер (или реиспользует существующий sandbox);
2)Монтирует только /mnt/data - временную директорию для файлов;
3)Запускает код через интерпретатор python (в jupyter-like окружении, без shell);
4)Возвращает stdout/stderr и артефакты файлов. Тоже страдает от того, что не можете скачать файл?
🤦♂️Привет стандартная ошибка и болезнь многих LLM чатов, когда он по запросу отдаёт файл, но ты не можешь его скачать. Поскольку файл остался внутри контейнера и ссылка не пробрасывается наружу. 3️⃣ Tools / Environment Layer - это уже нижний слой, набор конкретных инструментов: -Python sandbox, web-search, email-доступ, календарь, API-вызовы, -внешние базы данных, файловая система, память и т.д. -LLM не может обращаться к ним напрямую - только через агентный слой.
"python": для вычислений, "web": для поиска информации, "gcal": для чтения календаря.
Для модели внутри reasoning loop доступ выглядит так, будто у неё есть:
available_tools = [ "python", "web", "image_gen", "automations", "gcal", "gmail", "bio", "canmore", "api_tool"
]
Крч, без агента модель "говорит", с агентом - "действует", но только в разрешенных операторах. 💡На самом деле этот маленький кубик, а именно возможность передавать оркестратору задачи не через хардкод и миллион if-else, а гибкими командами, дало огромный буст для развития автономных систем.