Этот конспект не сохранится

Закроешь вкладку — потеряешь. Зарегистрируйся — и он будет в библиотеке навсегда.

Telegram

Ваш конспект

YouTubeПерестань упираться в лимиты Claude Code — сократил расход токенов на 86%

🎯 4 стратегии для сокращения расхода токенов в Claude Code

Ключевые тезисы:

  • Основной выигрыш в экономии токенов достигается не через промпты, а через специальные инструменты.
  • Четыре стратегии работают с разных сторон: сокращение входящих и исходящих токенов, оптимизация внутренних процессов.
  • Каждая стратегия имеет свои компромиссы, важно комбинировать их под конкретную задачу.

🔍 Стратегия 1: Индексирование кода (Code Graph)

Индексирование — это предварительное построение карты кода для быстрого поиска, аналогично работе поисковиков.

Как работает:

  • Без индекса Claude Code сканирует файлы через grep, glob, read для каждого поиска, тратя много токенов.
  • Инструмент (например, Code Graph) создаёт локальную базу данных (граф) символов, вызовов функций, импортов.
  • Поиск происходит мгновенно в графе, а не в файлах.

Результаты тестов:

  • TypeScript (10k файлов): -70% токенов, -33% стоимости.
  • Python (3k файлов): -70% токенов, -23% стоимости.
  • В среднем: -57% токенов, -25% стоимости.

⚠️ Нюансы:

  • Граф нужно обновлять вручную командой sn при изменениях в коде.
  • Может пропускать контекст из соседних claude.md файлов.
  • Есть альтернативы с автоматической синхронизацией (сложнее в настройке).

📉 Стратегия 2: Сжатие вывода (RTK Token Killer)

Инструмент RTK сокращает объём данных, которые Claude Code читает из терминала.

Принцип работы:

  • Перехватывает вывод bash-команд (grep, cat и др.).
  • Применяет фильтры: убирает шум, группирует строки, обрезает лишнее, схлопывает повторы.

Результаты экономии:

  • Команда grep/rg: -80% токенов (с 16k до 3.2k).
  • Команда cat: -70% токенов (с 40k до 12k).
  • За 30 минут сессии: ~80% экономии (с 11k до 24k токенов).

⚖️ Компромисс: При сжатии теряются данные. Для задач отладки, где важен каждый лог, инструмент лучше отключать.


✂️ Стратегия 3: Сжатие ответов Claude (Cavman)

Инструмент Cavman заставляет Claude Code отвечать короче, сохраняя смысл.

Зачем это нужно: Каждый ответ Claude добавляется в историю и снова отправляется в модель для следующего запроса. Короткие ответы замедляют «раздувание» контекста.

Пример:

  • Обычный ответ: 69 токенов.
  • Ответ с Cavman: 19 токенов («Новая ссылка при каждом рендере → оберни в useMemo»).

Режимы работы:

  • light — убирает лишние слова.
  • ultra — телеграфная речь (рекомендуется для рутинных задач).
  • Режимы для классического и китайского языков.

Результаты:

  • Отладка бага в React: -87% токенов.
  • Фикс авторизации: -83% токенов.
  • В среднем: ~65% экономии исходящих токенов.

⚖️ Компромисс: Меньше слов → меньше точность. Для сложного планирования нужен подробный ответ.


⚙️ Стратегия 4: Встроенные практики Claude Code

Это базовые привычки, которые не требуют установки инструментов, но сильно экономят лимиты.

  1. Команда context — показывает, что занимает место в контексте (например, огромные claude.md файлы или неиспользуемые MCP-серверы). Проведите аудит и удалите лишнее.
  2. Команда clear — очищайте контекст после завершения задачи. Не тащите историю предыдущей задачи в новую сессию.
  3. Переключение моделей — используйте разные модели под задачи:
    • haiku — для навигации и простых изменений.
    • sonnet — для средних задач.
    • opus — для сложного планирования и архитектуры (на нём не экономьте).
  4. Режим планирования — активируется через Shift перед вводом задачи. План составляет дешёвая haiku, а дорогие модели затем его выполняют, не сканируя код заново.

💡 Выводы

  • Для максимальной экономии комбинируйте инструменты: Code Graph (меньше обращений) + RTK (меньше данных за обращение) + Cavman (короче ответы).
  • Каждый инструмент имеет компромисс: ручное обновление, потеря данных или точности.
  • Управляемый расход = осознанный выбор, какие инструменты включать под конкретную задачу.
  • Хаотичная архитектура проекта заставляет Claude «ходить по кругу» и тратить токены впустую. Хорошая структура экономит токены и упрощает поддержку проекта.
🔧 4 стратегии для сокращения расхода токенов в Claude Code — конспект на EchoNote