2.0Kпросмотров
20.4%от подписчиков
15 марта 2026 г.
Score: 2.2K
Поиск с памятью: ИИ-агенты учатся не терять контекст Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 9 по 13 марта Databricks показал KARL (Knowledge Agents via Reinforcement Learning): ИИ-агента для корпоративного поиска, который специализируется на обоснованном рассуждении. Он способен автономно искать информацию в больших закрытых базах данных, извлекать нужные фрагменты и делать комплексные выводы на основе найденного. Команда разработала несколько новых подходов: бенчмарк KARLBench для оценки ИИ-агентов, включающий задачи от поиска сущностей до анализа корпоративных заметок: 1️⃣ Систему обучения Agentic Synthesis, где агент сам исследует базу документов, формулирует вопросы и отбирает полезные примеры. 2️⃣ Метод пост-обучения OAPL — более стабильный и дешёвый вариант офлайн-обучения с подкреплением. Всё вместе помогает агенту решать новые типы задач, которых не было в тренировочных данных. В тестах KARL обошёл Claude 4.6 и GPT-5.2 в задачах работы с корпоративными знаниями. При этом справляется с ними на 33% дешевле и на 47% быстрее. Почему это важно: для сложной аналитики компаниям не обязательно использовать крупные и дорогие модели. KARL показывает, что компактная система, обученная эффективным стратегиям поиска, даёт сопоставимый результат. Следующий этап корпоративного ИИ — агентные поисковые системы, которые сами выстраивают стратегию работы с данными и решают многошаговые задачи. Accenture представил Memex(RL): подход, который даёт ИИ-агентам индексированную память. Обычно агент работает только с тем, что умещается в его контекстное окно. Memex(RL) позволяет формировать структурированный опыт прошлых действий и результатов и извлекать нужное по необходимости. Это похоже на то, как человек использует заметки и закладки при работе с большим объёмом информации. При этом агент сам управляет этим процессом с помощью обучения с подкреплением: решает, когда разгрузить память, как озаглавить сохранённый фрагмент и когда его достать. В тестах ALFWorld успешность выполнения задач выросла с 24,2% до 85,6%. А пиковое потребление токенов контекста сократилось почти вдвое. Почему это важно: агенты начинают эффективно работать на длинных дистанциях, не забывают важные детали и не тратят лишние ресурсы на перечитывание разросшегося контекста. Это особенно нужно там, где задачи растянуты во времени или требуют множества шагов.
Также на неделе:
• OpenAI рассказал о наборе из 14 тысяч сложных задач для оценки способности ИИ-моделей контролировать процесс рассуждения с ограничениями на скрытые шаги
• Microsoft Research показал фреймворк для повышения безопасности ИИ-агентов при выполнении многошаговых задач со внешними инструментами
• Princeton University представил фреймворк, который превращает взаимодействие пользователя с ИИ-агентом в источник непрерывного обучения
• Meta (запрещена в РФ), OpenAI и xAI описали систему непрерывного улучшения моделей для развлекательных и социальных чатов
• Perplexity анонсировала ИИ-агента, способного работать локально на Mac mini
• NVIDIA выпустила модель Nemotron 3 Super
• Google представил Gemini Embedding 2 — первую нативно мультимодальную эмбеддинг-модель
• Microsoft совместно с Anthropic выпустил инструмент для выполнения сложных задач от имени пользователя в экосистеме Microsoft 365
• #AI_moment #трендвотчинг
↗️ red_mad_robot