Память и «сновидения»: как агенты учатся и совершенствуются
Ключевые тезисы:
Память позволяет агентам переносить знания и опыт между задачами, повышая их производительность.
«Сновидения» (Dreaming) — это новый процесс, который анализирует работу множества агентов, выявляет общие паттерны ошибок и автоматически оптимизирует общую память.
Ключевой принцип — «не мешать Клоду»: память смоделирована как файловая система, с которой модель уже умеет эффективно работать.
Система построена для работы в многопользовательских средах (multi-agent) с корпоративным контролем и наблюдаемостью.
Эволюция возможностей агентов
Развитие агентов привело к тому, что они могут выполнять всё более сложные и длительные задачи. Однако управление контекстом в таких сценариях оставалось сложной задачей. Память стала решением, позволяющим агентам учиться на предыдущем опыте.
Что даёт память?
Без памяти каждый агент начинает задачу «с чистого листа». С памятью агенты могут:
Учиться на общих стратегиях и прошлых ошибках.
Переносить знания между задачами, средами и даже другими агентами.
Создавать «рои агентов», которые совместно формируют и поддерживают общее понимание организации.
Результаты внедрения памяти:
- Rakuten: снижение ошибок первого прохода на 97%.
- WiseDocs: сокращение типовых проблем в процессе верификации документов.
Архитектура памяти в Claude Managed Agents
Система памяти построена вокруг трёх ключевых компонентов:
- Слой хранения (Storage Layer): Управление данными и отслеживание изменений.
- Структура памяти: Оптимизирована под файловую систему, чтобы Клод мог использовать свои сильные стороны (навигация, bash, grep).
- Обработка, управляемая Claude: Агенты обновляют память «по ходу дела», как делают заметки.
Проблема локальной оптимизации и рождение «Сновидений»
При масштабировании на многопользовательские системы проявились ограничения:
Агенты повторяли одни и те же ошибки, учась только на своём опыте.
В памяти возникали дублирование и фрагментация.
Обновления были локально оптимальными, но не глобально оптимальными.
Решение — «Сновидения» (Dreaming): Это процесс обратной связи, который:
Анализирует транскрипты множества сессий и агентов.
Ищет паттерны в ошибках и неэффективности.
Автоматически организует, курирует и оптимизирует общую память.
Пример: Harvey достиг 6-кратного увеличения процента выполнения своих юридических тестов.
Как работают «Сновидения»?
- Пакетный и внеполосный процесс: Запускается отдельно от основных сессий агентов (ночью, по часам, по событию).
- Гибкость: Управляется через API, можно запускать ad-hoc или по расписанию.
- Результат: Создаётся проверенный, лучше организованный снимок памяти, который агенты могут принять.
- Архитектурные преимущества:
Полезно для систем с множеством агентов (анализ кросс-сессий).
Чистое разделение: нет компромисса между улучшением памяти и выполнением задачи.
Нулевая задержка для «горячего» пути агента.
Демо: Платформа агентов для SRE (Site Reliability Engineering)
Сценарий: Система обрабатывает инциденты и алерты.
- Агенты имеют доступ к двум типам памяти:
- Только для чтения: Организационная память (SLO, runbooks, график дежурств).
- Для чтения и записи: Контекстная память под конкретную задачу.
- Пример работы: Первый агент обнаружил причину алерта и начал исправление, записав в память, что «фикс в процессе». Следующий агент, увидев схожую проблему, уже знал из памяти о готовящемся исправлении и действовал соответственно.
- Корпоративный контроль: Полная история версий памяти, атрибуция правок, модель оптимистичного контроля параллелизма для предотвращения конфликтов.
Выводы
- Память поднимает базовый уровень производительности каждого агента.
- «Сновидения» поднимают его ещё выше, обеспечивая глобальную оптимизацию знаний.
- Вместе они формируют основу для фронтальной системы памяти организационного масштаба, где память становится огромным источником знаний о мире, в котором работают агенты.
- Это критически важно для будущего, где агенты будут работать непрерывно в течение дней и постоянно улучшать своё понимание мира.