Новый headless-браузер написанный специально для AI-агентов. Сейчас почти все AI-агенты, которые автоматизируют работу с сайтами, используют Chrome под капотом. Но есть проблема. 🔹Chrome тяжёлый, полноценный десктопный браузер с графическим движком, рендерером, плагинами, интерфейсом и всеми функциями для человека. Даже когда он запущен без окна (headless), то грузит сотни мегабайт памяти, чтобы поддерживать всё это. При том, что вам может быть нужно просто получить HTML или кликнуть по кнопке....
Битрикс24 Vibecode
Канал для всех, кому интересно узнать, что такое MCP, зачем нужны и какие уже есть MCP, как они работают и что умеют. Как MCP будет работать в Битрикс24. И как разработчики и рядовые пользователи могут использовать MCP для улучшения взаимодействия с ИИ.
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20MCP Hub приехал в Битрикс24 🔌 Теперь в редакторе бизнес-процессов и с агентом Мартой можно напрямую подключать внешние сервисы – и работать с ними прямо в чате, без переходов. Что уже доступно? 🧩 — Предустановленные: Контур.Фокус (уже тут), далее – 1С, Gmail, Google Drive — Из Маркета: Notion и другие интеграции Как это работает? 💡 Пишете Марте: «Проверь компанию ООО Ромашка» – она сама лезет в Контур.Фокус, вытягивает реквизиты и возвращает всё в чат. Никаких вкладок, никаких копипастов. Под...
Theory of Space: могут ли ИИ-агенты строить карты пространства? Исследование от Stanford, University of Washington и Cornell (ICLR 2026) проверяет, способны ли языковые модели самостоятельно исследовать незнакомую среду и строить её внутреннюю карту – как это делает человек. Задача: агент стартует в незнакомом пространстве с несколькими комнатами. Он должен сам решать, куда двигаться и куда смотреть, фиксировать объекты в JSON и использовать накопленные данные для ответа на пространственные вопр...
Anthropic изучил, как люди используют ИИ-агентов на практике Анализ более миллиона сессий в Claude Code и через публичный API показал, как реальные пользователи взаимодействуют с агентами – без идеализации, только по данным. 🔹 Длительность сессий растёт — Медианная продолжительность самых длинных сессий выросла с 25 до 45+ минут за 3 месяца. — Рост не связан с обновлениями модели – значит, люди меняют подход, а не возможности. 🔹 Опытные пользователи доверяют больше, но контролируют точнее — 20...
Mistral AI приобретает Koyeb – стартап с технологией безопасного запуска ИИ-агентов, а это внедрение изоляции как стандарта для ИИ-агентов Mistral AI купила Koyeb – компанию, разрабатывавшую serverless-платформу для развертывания ИИ-приложений. Основная цель – интегрировать их технологию Koyeb Sandboxes в экосистему Mistral. 🔹 Что такое Koyeb Sandboxes — Изолированные среды для запуска ИИ-агентов. — Каждый агент работает в собственном окружении – без доступа к другим процессам, данным или систе...
SkillsBench: как готовые навыки влияют на эффективность LLM-агентов Исследование SkillsBench (15+ университетов) протестировало 84 задачи из 11 доменов с 7 моделями – в трёх сценариях: без навыков, с готовыми навыками, с навыками, сгенерированными самой моделью. Всего – 7 308 траекторий, проверенных через pytest. 🔹 Готовые навыки повышают точность, но не везде одинаково — Средний прирост pass rate: +16,2 п.п. (с 24,3% до 40,6%). — В медицине: +51,9% – модели плохо обучены клиническим протоколам...
MiroFish: мультиагентная симуляция социальных процессов на основе ИИ Репозиторий MiroFish – открытый движок для моделирования поведения множества ИИ-агентов в условиях информационного воздействия. Каждый агент имеет собственную память, способен к взаимодействию и принимает решения на основе входных данных. 🔹 Что делает — Запускает тысячи независимых агентов, каждый из которых обрабатывает текстовые входы (новости, заявления, отчёты), и реагирует в соответствии с внутренними паттернами. — Симули...
Perplexity анонсировала концепцию агента, который работает круглосуточно без участия пользователя. Этот агент интегрирован с локальными файлами и приложениями на выделенном Mac mini и выполняет сложные рабочие процессы самостоятельно. Тяжёлые вычисления обрабатываются на серверах Perplexity, а взаимодействие с десктопом остаётся локальным – для скорости и приватности. Ядро – собственный оркестратор, который динамически выбирает оптимальную модель под задачу. Управлять агентом можно удалённо с лю...
Бенчмарки качества для AI-агентов: как перейти от «вроде работает» к измеримым результатам Когда AI-агент в продакшене начинает давать некорректные ответы, сложно понять: это новая ошибка, регрессия после правки промпта, или просто редкий кейс? Ручное тестирование не масштабируется – особенно при частых изменениях. Мы построили систему автоматической оценки качества для агента Марта в Битрикс24. И хотим поделиться с вами этим опытом. Вот ключевые этапы: 🔹Observability Подключили Langfuse – соби...
ByteDance перезапустила DeerFlow – теперь это полноценный рантайм для агентов, а не просто фреймворк. Основа – LangGraph + LangChain. Главный агент получает задачу, разбивает её на подзадачи и порождает суб-агентов на лету. Каждый суб-агент работает в изолированном контексте: не видит данные других агентов или главного процесса. Суб-агенты выполняются параллельно, возвращают структурированные результаты – главный агент собирает их в финальный ответ. Сессия запускается в отдельном Docker-контейне...