Поиск с памятью: ИИ-агенты учатся не терять контекст Аналити — @Redmadnews

2.0Kпросмотров

20.4%от подписчиков

15 марта 2026 г.

Score: 2.2K

Поиск с памятью: ИИ-агенты учатся не терять контекст Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 9 по 13 марта Databricks показал KARL (Knowledge Agents via Reinforcement Learning): ИИ-агента для корпоративного поиска, который специализируется на обоснованном рассуждении. Он способен автономно искать информацию в больших закрытых базах данных, извлекать нужные фрагменты и делать комплексные выводы на основе найденного. Команда разработала несколько новых подходов: бенчмарк KARLBench для оценки ИИ-агентов, включающий задачи от поиска сущностей до анализа корпоративных заметок: 1️⃣ Систему обучения Agentic Synthesis, где агент сам исследует базу документов, формулирует вопросы и отбирает полезные примеры. 2️⃣ Метод пост-обучения OAPL — более стабильный и дешёвый вариант офлайн-обучения с подкреплением. Всё вместе помогает агенту решать новые типы задач, которых не было в тренировочных данных. В тестах KARL обошёл Claude 4.6 и GPT-5.2 в задачах работы с корпоративными знаниями. При этом справляется с ними на 33% дешевле и на 47% быстрее. Почему это важно: для сложной аналитики компаниям не обязательно использовать крупные и дорогие модели. KARL показывает, что компактная система, обученная эффективным стратегиям поиска, даёт сопоставимый результат. Следующий этап корпоративного ИИ — агентные поисковые системы, которые сами выстраивают стратегию работы с данными и решают многошаговые задачи. Accenture представил Memex(RL): подход, который даёт ИИ-агентам индексированную память. Обычно агент работает только с тем, что умещается в его контекстное окно. Memex(RL) позволяет формировать структурированный опыт прошлых действий и результатов и извлекать нужное по необходимости. Это похоже на то, как человек использует заметки и закладки при работе с большим объёмом информации. При этом агент сам управляет этим процессом с помощью обучения с подкреплением: решает, когда разгрузить память, как озаглавить сохранённый фрагмент и когда его достать. В тестах ALFWorld успешность выполнения задач выросла с 24,2% до 85,6%. А пиковое потребление токенов контекста сократилось почти вдвое. Почему это важно: агенты начинают эффективно работать на длинных дистанциях, не забывают важные детали и не тратят лишние ресурсы на перечитывание разросшегося контекста. Это особенно нужно там, где задачи растянуты во времени или требуют множества шагов. Также на неделе:  • OpenAI рассказал о наборе из 14 тысяч сложных задач для оценки способности ИИ-моделей контролировать процесс рассуждения с ограничениями на скрытые шаги  • Microsoft Research показал фреймворк для повышения безопасности ИИ-агентов при выполнении многошаговых задач со внешними инструментами  • Princeton University представил фреймворк, который превращает взаимодействие пользователя с ИИ-агентом в источник непрерывного обучения • Meta (запрещена в РФ), OpenAI и xAI описали систему непрерывного улучшения моделей для развлекательных и социальных чатов • Perplexity анонсировала ИИ-агента, способного работать локально на Mac mini • NVIDIA выпустила модель Nemotron 3 Super • Google представил Gemini Embedding 2 — первую нативно мультимодальную эмбеддинг-модель • Microsoft совместно с Anthropic выпустил инструмент для выполнения сложных задач от имени пользователя в экосистеме Microsoft 365 • #AI_moment #трендвотчинг ↗️ red_mad_robot

Другие посты @Redmadnews