Создание доступных AI-агентов для маркетологов с Claude
Ключевые тезисы:
Создание качественных и доступных AI-агентов — сложная задача, особенно для нетехнических пользователей (маркетологов).
Ключ к успеху — целенаправленная борьба с точками трения (friction points) в пользовательском опыте и обеспечении качества.
Переход от сложных node-based workflow к документному интерфейсу и агентской архитектуре резко снизил порог входа и ускорил внедрение.
Качество вывода агента зависит не только от модели (Claude), но и от инженерной работы с инструментами (tools), контекстом и под-агентами (sub-agents).
Контекст: Проблема AirOps
AirOps — платформа для роста маркетинга в AI-поиске (аналог SEO для ChatGPT, Gemini, Claude).
Исходная проблема:
- Старая платформа использовала сложный node-based workflow builder (визуальный редактор с узлами).
- Для создания контента маркетологам приходилось разбираться в Liquid, JSON, обновлять шаги при выходе новых моделей.
- Процесс был сложным, хрупким и долгим (внедрение занимало около месяца).
- Существовал потолок сложности для нетехнических пользователей.
Стратегия: Фокус на двух точках трения
Чтобы сделать силу Claude доступной для маркетологов, AirOps сконцентрировался на двух главных проблемах:
###
1. Встраивание в рабочий процесс маркетолога
Задача: сделать создание агентов интуитивным и контролируемым.
Решение — Playbooks (документный интерфейс):
Документный стиль вместо node-based редактора: Маркетологи привыкли к Google Docs. Playbook — это документ, где через слэш-команды (/) можно определять входы, выходы и инструменты.
Прозрачность: Пользователь видит, какой инструмент используется и какой контекст подается на каждом этапе, прямо в документе.
Контроль: Сохранение чувства управления недетерминированным (агентским) процессом.
Встроенный human-in-the-loop (человеческое участие):- Возможность назначать ревьюеров в конце каждого раздела Playbook.
- Агент останавливается и ждет одобрения или правок от назначенного человека.
- Уведомления о необходимости ревью приходят в внутренний инбокс AirOps.
- Функция Grid позволяет управлять human review в масштабе, отслеживая множество запущенных задач.
###
2. Обеспечение качества и консистентности вывода
Задача: гарантировать, что агенты производят стабильно качественный контент.
Подход — "Инженерия упряжки" (Harness Engineering):
Модель (Claude) — это двигатель, но всё, что построено вокруг него (инструменты, контекст, оркестрация), критически важно.
Ключевые улучшения:
Специализированные инструменты (Tools) вместо примитивных:
- Проблема: Агент делал множество вызовов простых инструментов (скрапинг, анализ трафика), что было неэффективно по токенам и времени.
- Решение: Создание специализированных "инструментов-заданий".
- Пример: Один инструмент
analyze_pageвозвращает всю структурированную информацию о странице, пробелах в контенте и ключевых запросах, вместо 20 отдельных вызовов. - Результат: -8% потребления токенов и увеличение скорости.
- Пример: Один инструмент
Использование под-агентов (Sub-agents) для фокуса:
- Бренд-кит агент: Запускается в начале, собирает весь контекст о бренде и сохраняет его как артефакт. Все остальные агенты ссылаются на этот единый артефакт, обеспечивая консистентность.
- Агент проверки соответствия (Compliance): Отдельный агент проверяет контент на соответствие бренд-гайдлайнам, не засоряя основное контекстное окно.
- Агент написания (Writing): Отдельный агент, сфокусированный только на написании текста, без отвлечения на исследовательский контекст.
- Преимущество: Каждый под-агент работает с ограниченным и релевантным контекстом, что повышает качество и предсказуемость.
Результаты внедрения агентов
- Parallel (кейс): Увеличение цитируемости на 130%, доли голоса на 42%. Внедрение заняло 1 неделю вместо месяца.
- 10 корпоративных клиентов в бета-тесте начали публиковать контент менее чем за 2 недели (ранее требовалось длительное внедрение).
- Самообслуживание: Маркетологи получили возможность самостоятельно создавать и запускать качественные рабочие процессы.
Следующие точки трения для решения
AirOps продолжает "гоняться за трением":
- Самоулучшение и обратная связь: Как эффективно структурировать summaries трасс агентов, собирать релевантные "воспоминания" и намеренно "забывать" ненужное.
- Бенчмаркинг для создания контента: Создание объективных метрик для оценки качества контента (где много субъективного "вкуса"), чтобы измерять реальное улучшение от изменений в архитектуре агентов, а не полагаться на "вибрации".
Вывод: Создание production-готовых агентов для нетехнических пользователей — это непрерывный процесс борьбы с трением через глубокое понимание workflow пользователя, инженерию вокруг модели для гарантии качества и внедрение человеческого контроля в ключевых точках.