Мы стартовали обучающий курс по созданию агентных систем. Я решил параллельно выкладывать в канал короткие заметки, чтобы можно было постепенно погружаться в методологию и собирать целостную картину. Начнём с самого базового — разберём, что вообще такое агент в современном представлении и из каких частей он состоит. Анатомия агента Перед нами развернутая архитектура агента, логика работы которого выстраивается слева направо. В самом начале процесса определяется источник запроса, то есть от кого ...
О чем молчит AI CTO
Привет! Я Влад, CTO по AI в red_mad_robot. Здесь делюсь применении AI в бизнесе, разбираю технологии и публикую интересные материалы из жизни.
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
16 из 16Lucy от Decart AI Заметили, как редко мы стали включать камеры? Видеозвонки превратились в обмен аудиосообщениями, мы все стали «черными квадратами» в Зуме, камеры выключены, живой контакт потерян. Но то, что сделали эти ребята — новый виток технологического сдвига, который коснется каждого. У них получилось создать RealTime-редактирование видео по текстовому запросу. Детей уже не оторвать от экрана, да и взрослым тоже заходит, так как цензуру не завезли. Пока демо бесплатное, подключайтесь и на...
Anthropic Agentic Coding Trends Report 2026 Хотите понять, что нас ждет в этом году — полистайте этот отчет. Скажу только, что мысли, которые я озвучивал раньше, очень совпадают с тем, как Anthropic видит будущее разработки. Там и про сокращение циклов с недель до дней или часов. И про то, что главная польза кодовых агентов не в том, что мы делаем ту же работу быстрее, а в том, что мы успеваем выдавать гораздо больший объем результатов. А так же кодовые агенты уже превратились в инструмент не то...
Сломанный SDLC Разработка классического программного обеспечения по SDLC — даже с активным применением AI-инструментов вроде Claude Code, Codex или Cursor — и разработка продуктов, в основе которых лежит AI для конечного пользователя, — это принципиально разные процессы. При этом каждый из них претерпевает изменения по-своему. AI для SDLC Современные AI инструменты ускоряют написание кода, рефакторинг, тестирование, документацию и ревью, они быстро эволюционируют: например, Anthropic добавляет в...
Playwright CLI: браузер как часть feedback loop для кодового агента Когда мы говорим про кодовых агентов, фокус обычно уходит в генерацию кода. Но на фронтенде агенту мало «починить баг» — ему нужно тут же проверить интерфейс: открыть страницу, пройти сценарий, сравнить скриншоты. Логичным ответом на этот запрос выглядит свежий Playwright CLI. Инструмент встраивает браузерную автоматизацию прямо в workflow агента, превращая ее в базовый навык. Зачем агенту CLI Агент получает набор коротких CLI-к...
Google Cloud AI Agent Trends 2026 Я обратил внимание на этот тренд, потому что он мне очень сильно отзывается: 1. Агент для каждого сотрудника Персональный агент под роль и ежедневные задачи конкретного человека. Хорошие живые примеры — эксперименты у Валеры: Topsha и Valedesk, Codex App с инструментами автоматизации и Anthropic Cowork. 2. Агент для каждого рабочего процесса Описанный мною подход о том, что агента можно описывать как бизнес-функцию естественно встраивает его в рабочие бизнес-про...
LLM как Inference Engine. Часть 1 В архитектуре агента Большая Языковая Модель (LLM) выполняет когнитивную функцию, в отличие от классического кода, этот компонент стохастичен (вероятностен), ресурсоемок и является главным «узким горлышком» системы по скорости и стоимости. Рассмотрим LLM как Inference Engine для агентной системы. Стратегия развертывания Существует три основных подхода к развертыванию языковой модели - это баланс между тремя: Приватность, Сложность и Стоимость. SaaS (Model-as-a-S...
Иллюзия контроля: с чем придется расстаться ради x10 в разработке Я все чаще ловлю себя на мысли, что настоящий скачок скорости в разработке упирается не в новые модели и не в желание «еще быстрее писать код». Он упирается в гораздо более болезненную вещь: ради ускорения в 10 раз нам придется отказаться от привычного чувства контроля. Контроль в нашем мире — это когда ты читаешь код, держишь в голове архитектуру и видишь каждую причинно-следственную связь. Ты буквально на кончиках пальцев чувств...
System Design: не про теорию, а про мышление Эта книга объясняет важное — как думать, когда готового ответа нет. Ранее я уже писал, что разработка агентных систем держится на двух опорах: инженерной и исследовательской. Инженерный подход даёт предсказуемость и устойчивость. Исследовательский — помогает работать с неопределённостью и находить рабочие решения там, где нет готового шаблона. На этом фоне прочитал книгу из серии System Design: подготовка к сложному интервью по Gen AI. Для меня её гла...
LLM как Inference Engine. Часть 2 Ограничения пропускной способности Любая система инференса ограничена количеством запросов и объёмом обрабатываемого текста за единицу времени и характеризуется параметрами: RPM (Requests per Time Unit) — лимит на число обращений. TPM (Tokens per Time Unit) — ограничение на суммарный объём входного и выходного текста. Эти ограничения вынуждают осознанно проектировать количество reasoning-шагов, инструментальных вызовов и параллельных агентов. Наивное масштабиров...