🤖 Loop Engineering: переход от промтов к автономным агентам

Loop Engineering: переход от промтов к автономным агентам

Ключевые тезисы:

Промтинг устарел — будущее за автономными циклами (loops)
Три команды в Claude Code (/goal, /loop, /workflows) кардинально меняют подход к работе с ИИ
Loop Engineering — это проектирование систем, которые сами промтят агентов
Самоулучшающиеся циклы (Self-Improving Loops) создают накапливаемое конкурентное преимущество
У технологии есть реальные издержки, требующие дисциплины

Формирование тренда

Согласие конкурентов как сигнал:

Глава продукта Anthropic (Борис Черных) и инженер из OpenAI (Питер Штайнберг) независимо заявили одно и то же: «Перестаньте промтить агентов. Проектируйте системы, которые делают это за вас».
Это не спор, а сигнал о сдвиге парадигмы в индустрии.

От разговора к продукту за неделю:

Эди Османи (Google) дал практике название Loop Engineering.
Появились готовые инструменты: учебник «Loop Engineering Orange Box», сайт loopsalarm.xyz с шаблонами, библиотека LOP Library с 29 готовыми циклами.

Три ключевые команды Claude Code

1. Команда /goal — постановка цели

Вы задаете финальный результат, а не шаги. Агент работает автономно до достижения цели.
Как работает: Используется архитектура «адвокат и прокурор»:
- Умный агент (дорогой): выполняет задачу (читает файлы, чинит баги).
- Тупой агент (дешёвый): только проверяет доказательства в чате и решает, достигнута ли цель.

Шаблон использования:

/goal
Артефакт: [конкретный ожидаемый результат]
Финишная черта: [проверяемое условие]
Докажи, что: [что напечатать в чат как доказательство]
Покажи мне: [финальный отчёт]
Если упёрся: [что логировать, когда сдаваться]

Типичные ошибки новичков:
- Размытая цель (например, «сделай продакшн»). Исправление: конкретный артефакт или метрика («все 47 тестов проходят»).
- Невыполнимая цель (нет доступа). Всегда добавлять секцию «Если упёрся».
- Цель-комбайн (несколько финишных черт в одной). Разбивать на последовательные /goal.

2. Команда /loop — повторяющиеся проверки

Запускает задачу по расписанию (каждые 5 минут, каждый час).
Когда использовать: мониторинг, регулярные дайджесты, контроль сборки.

3. Команда /workflows — мультиагентная оркестрация

Задача разбивается на множество подзадач, которые выполняются параллельно разными агентами.
Когда использовать: большие аудиты кода, миграции, исследования по множеству источников.
Секретный триггер: Напишите в чате слово «ультракод» + задачу. Claude сам соберёт harness и построит workflow.

Паттерн Self-Improving Loops (Самоулучшающиеся циклы)

Идея: Дешёвая модель делает, дорогая проверяет, успешный workflow сохраняется как навык.

Архитектура:

Дешёвая модель (например, QwQ 2.6): Запускает рои из сотен параллельных агентов. Позволяет быть расточительным в экспериментах.
Дорогая модель-верификатор (Claude Opus 4.8): Единственная задача — искать ошибки в результатах дешёвой модели. Результат считается «виновным, пока не доказана невиновность».
Механика самоулучшения:
- Skills (Навыки): После успешного запуска система сохраняет весь workflow как «скилл». Следующий аналогичный запуск занимает секунды.
- Constraints.md: Файл правил в формате Markdown. Каждая ошибка, найденная верификатором, превращается в новое правило для следующих запусков.

7 шагов к внедрению:

Пишите не промт, а спецификацию (конкретный ожидаемый вывод).
Читайте план разбиения от ИИ перед запуском (экономия токенов).
Запускайте параллельных агентов на дешёвой модели.
Ставьте дорогую модель строго на верификацию.
Успешный workflow сохраняйте как скилл.
Обратную связь верификатора добавляйте в constraints.md.
Стабилизировавшийся скилл превращайте в фонового агента (по расписанию или триггеру).

Четыре издержки Loop Engineering

Verification Debt (Долг проверки): Перестав проверять каждый шаг, можно потерять понимание системы. Лечение: Периодически вручную просматривайте сгенерированный код.
Compression Rot (Гниение понимания): Кодовая база растёт, а ментальная модель в голове — нет. Лечение: Раз в неделю полностью читайте diff'ы.
Token Expenses (Счёт за токены): Множественные вызовы моделей могут стоить тысячи долларов. Лечение: Рассчитывайте бюджет до запуска и ставьте лимиты на API-ключ.
Cognitive Surrender (Когнитивная капитуляция): Мозг расслабляется и разучивается решать сложные задачи. Лечение: Раз в неделю делайте одну задачу полностью вручную.

Готовые продакшн-лупы (из репозитория Cobus Greyling)

Daily 3H: Ежедневная автосортировка входящих задач и писем по приоритету.
PR Digest: Автоматический summary изменений в коде команды.
Dependency Sweeper: Еженедельная проверка библиотек на уязвимости и создание PR с обновлениями.
Changelog Drafter: Автосборка человекочитаемого списка изменений за неделю.

Фазовый rollout (постепенный запуск):

Уровень 1: Луп только наблюдает и присылает отчёты («Вот что бы я сделал»).
Уровень 2: Луп предлагает действия и ждёт вашего подтверждения.
Уровень 3: Полностью автономный режим (только после месяца стабильной работы на уровнях 1 и 2).

Выводы

Промт — это инструкция. Луп (/goal) — это цель. Переход от первого ко второму необратим и кардинально меняет эффективность работы.
Loop Engineering — это не магическая кнопка, а дисциплина проектирования автономных систем.
Ключевой навык — умение формулировать задачи словами, которые машина может проверить, без чтения ваших мыслей.
Будущее за компондируемыми системами, где каждый успешный запуск делает следующий быстрее, дешевле и точнее, создавая уникальное конкурентное преимущество.