Этот конспект не сохранится

Закроешь вкладку — потеряешь. Зарегистрируйся — и он будет в библиотеке навсегда.

Telegram

Ваш конспект

YouTubeMemory and dreaming for self learning agents

🧠 Память и «сновидения»: как агенты учатся и совершенствуются

Ключевые тезисы:

  • 🔥 Память позволяет агентам переносить знания и опыт между задачами, повышая их производительность.
  • 🚀 «Сновидения» (Dreaming) — это новый процесс, который анализирует работу множества агентов, выявляет общие паттерны ошибок и автоматически оптимизирует общую память.
  • 🎯 Ключевой принцип — «не мешать Клоду»: память смоделирована как файловая система, с которой модель уже умеет эффективно работать.
  • 🌐 Система построена для работы в многопользовательских средах (multi-agent) с корпоративным контролем и наблюдаемостью.

📜 Эволюция возможностей агентов

Развитие агентов привело к тому, что они могут выполнять всё более сложные и длительные задачи. Однако управление контекстом в таких сценариях оставалось сложной задачей. Память стала решением, позволяющим агентам учиться на предыдущем опыте.

🎯 Что даёт память?

Без памяти каждый агент начинает задачу «с чистого листа». С памятью агенты могут:

  • ✅ Учиться на общих стратегиях и прошлых ошибках.
  • ✅ Переносить знания между задачами, средами и даже другими агентами.
  • ✅ Создавать «рои агентов», которые совместно формируют и поддерживают общее понимание организации.

Результаты внедрения памяти:

  • Rakuten: снижение ошибок первого прохода на 97%.
  • WiseDocs: сокращение типовых проблем в процессе верификации документов.

🗂️ Архитектура памяти в Claude Managed Agents

Система памяти построена вокруг трёх ключевых компонентов:

  1. Слой хранения (Storage Layer): Управление данными и отслеживание изменений.
  2. Структура памяти: Оптимизирована под файловую систему, чтобы Клод мог использовать свои сильные стороны (навигация, bash, grep).
  3. Обработка, управляемая Claude: Агенты обновляют память «по ходу дела», как делают заметки.

🔄 Проблема локальной оптимизации и рождение «Сновидений»

При масштабировании на многопользовательские системы проявились ограничения:

  • ❌ Агенты повторяли одни и те же ошибки, учась только на своём опыте.
  • ❌ В памяти возникали дублирование и фрагментация.
  • ❌ Обновления были локально оптимальными, но не глобально оптимальными.

Решение — «Сновидения» (Dreaming): Это процесс обратной связи, который:

  • 🔍 Анализирует транскрипты множества сессий и агентов.
  • 🎯 Ищет паттерны в ошибках и неэффективности.
  • ✨ Автоматически организует, курирует и оптимизирует общую память.
  • 📈 Пример: Harvey достиг 6-кратного увеличения процента выполнения своих юридических тестов.

💡 Как работают «Сновидения»?

  • Пакетный и внеполосный процесс: Запускается отдельно от основных сессий агентов (ночью, по часам, по событию).
  • Гибкость: Управляется через API, можно запускать ad-hoc или по расписанию.
  • Результат: Создаётся проверенный, лучше организованный снимок памяти, который агенты могут принять.
  • Архитектурные преимущества:
    • ✅ Полезно для систем с множеством агентов (анализ кросс-сессий).
    • ✅ Чистое разделение: нет компромисса между улучшением памяти и выполнением задачи.
    • ✅ Нулевая задержка для «горячего» пути агента.

🏢 Демо: Платформа агентов для SRE (Site Reliability Engineering)

Сценарий: Система обрабатывает инциденты и алерты.

  • Агенты имеют доступ к двум типам памяти:
    1. Только для чтения: Организационная память (SLO, runbooks, график дежурств).
    2. Для чтения и записи: Контекстная память под конкретную задачу.
  • Пример работы: Первый агент обнаружил причину алерта и начал исправление, записав в память, что «фикс в процессе». Следующий агент, увидев схожую проблему, уже знал из памяти о готовящемся исправлении и действовал соответственно.
  • Корпоративный контроль: Полная история версий памяти, атрибуция правок, модель оптимистичного контроля параллелизма для предотвращения конфликтов.

🚀 Выводы

  • Память поднимает базовый уровень производительности каждого агента.
  • «Сновидения» поднимают его ещё выше, обеспечивая глобальную оптимизацию знаний.
  • Вместе они формируют основу для фронтальной системы памяти организационного масштаба, где память становится огромным источником знаний о мире, в котором работают агенты.
  • Это критически важно для будущего, где агенты будут работать непрерывно в течение дней и постоянно улучшать своё понимание мира.