Loop Engineering: переход от промтов к автономным агентам
Ключевые тезисы:
- Промтинг устарел — будущее за автономными циклами (loops)
- Три команды в Claude Code (
/goal,/loop,/workflows) кардинально меняют подход к работе с ИИ - Loop Engineering — это проектирование систем, которые сами промтят агентов
- Самоулучшающиеся циклы (Self-Improving Loops) создают накапливаемое конкурентное преимущество
- У технологии есть реальные издержки, требующие дисциплины
Формирование тренда
Согласие конкурентов как сигнал:
- Глава продукта Anthropic (Борис Черных) и инженер из OpenAI (Питер Штайнберг) независимо заявили одно и то же: «Перестаньте промтить агентов. Проектируйте системы, которые делают это за вас».
- Это не спор, а сигнал о сдвиге парадигмы в индустрии.
От разговора к продукту за неделю:
- Эди Османи (Google) дал практике название Loop Engineering.
- Появились готовые инструменты: учебник «Loop Engineering Orange Box», сайт
loopsalarm.xyzс шаблонами, библиотека LOP Library с 29 готовыми циклами.
Три ключевые команды Claude Code
1. Команда /goal — постановка цели
- Вы задаете финальный результат, а не шаги. Агент работает автономно до достижения цели.
- Как работает: Используется архитектура «адвокат и прокурор»:
- Умный агент (дорогой): выполняет задачу (читает файлы, чинит баги).
- Тупой агент (дешёвый): только проверяет доказательства в чате и решает, достигнута ли цель.
- Шаблон использования:
/goal Артефакт: [конкретный ожидаемый результат] Финишная черта: [проверяемое условие] Докажи, что: [что напечатать в чат как доказательство] Покажи мне: [финальный отчёт] Если упёрся: [что логировать, когда сдаваться] - Типичные ошибки новичков:
Размытая цель (например, «сделай продакшн»).
Исправление: конкретный артефакт или метрика («все 47 тестов проходят»).
Невыполнимая цель (нет доступа).
Всегда добавлять секцию «Если упёрся».
Цель-комбайн (несколько финишных черт в одной).
Разбивать на последовательные /goal.
2. Команда /loop — повторяющиеся проверки
- Запускает задачу по расписанию (каждые 5 минут, каждый час).
- Когда использовать: мониторинг, регулярные дайджесты, контроль сборки.
3. Команда /workflows — мультиагентная оркестрация
- Задача разбивается на множество подзадач, которые выполняются параллельно разными агентами.
- Когда использовать: большие аудиты кода, миграции, исследования по множеству источников.
Секретный триггер: Напишите в чате слово «ультракод» + задачу. Claude сам соберёт harness и построит workflow.
Паттерн Self-Improving Loops (Самоулучшающиеся циклы)
Идея: Дешёвая модель делает, дорогая проверяет, успешный workflow сохраняется как навык.
Архитектура:
- Дешёвая модель (например, QwQ 2.6): Запускает рои из сотен параллельных агентов. Позволяет быть расточительным в экспериментах.
- Дорогая модель-верификатор (Claude Opus 4.8): Единственная задача — искать ошибки в результатах дешёвой модели. Результат считается «виновным, пока не доказана невиновность».
- Механика самоулучшения:
- Skills (Навыки): После успешного запуска система сохраняет весь workflow как «скилл». Следующий аналогичный запуск занимает секунды.
- Constraints.md: Файл правил в формате Markdown. Каждая ошибка, найденная верификатором, превращается в новое правило для следующих запусков.
7 шагов к внедрению:
- Пишите не промт, а спецификацию (конкретный ожидаемый вывод).
- Читайте план разбиения от ИИ перед запуском (экономия токенов).
- Запускайте параллельных агентов на дешёвой модели.
- Ставьте дорогую модель строго на верификацию.
- Успешный workflow сохраняйте как скилл.
- Обратную связь верификатора добавляйте в constraints.md.
- Стабилизировавшийся скилл превращайте в фонового агента (по расписанию или триггеру).
Четыре издержки Loop Engineering
- Verification Debt (Долг проверки): Перестав проверять каждый шаг, можно потерять понимание системы.
Лечение: Периодически вручную просматривайте сгенерированный код. - Compression Rot (Гниение понимания): Кодовая база растёт, а ментальная модель в голове — нет.
Лечение: Раз в неделю полностью читайте diff'ы. - Token Expenses (Счёт за токены): Множественные вызовы моделей могут стоить тысячи долларов.
Лечение: Рассчитывайте бюджет до запуска и ставьте лимиты на API-ключ. - Cognitive Surrender (Когнитивная капитуляция): Мозг расслабляется и разучивается решать сложные задачи.
Лечение: Раз в неделю делайте одну задачу полностью вручную.
Готовые продакшн-лупы (из репозитория Cobus Greyling)
- Daily 3H: Ежедневная автосортировка входящих задач и писем по приоритету.
- PR Digest: Автоматический summary изменений в коде команды.
- Dependency Sweeper: Еженедельная проверка библиотек на уязвимости и создание PR с обновлениями.
- Changelog Drafter: Автосборка человекочитаемого списка изменений за неделю.
Фазовый rollout (постепенный запуск):
- Уровень 1: Луп только наблюдает и присылает отчёты («Вот что бы я сделал»).
- Уровень 2: Луп предлагает действия и ждёт вашего подтверждения.
- Уровень 3: Полностью автономный режим (только после месяца стабильной работы на уровнях 1 и 2).
Выводы
- Промт — это инструкция. Луп (
/goal) — это цель. Переход от первого ко второму необратим и кардинально меняет эффективность работы. - Loop Engineering — это не магическая кнопка, а дисциплина проектирования автономных систем.
- Ключевой навык — умение формулировать задачи словами, которые машина может проверить, без чтения ваших мыслей.
- Будущее за компондируемыми системами, где каждый успешный запуск делает следующий быстрее, дешевле и точнее, создавая уникальное конкурентное преимущество.