4 стратегии для сокращения расхода токенов в Claude Code
Ключевые тезисы:
- Основной выигрыш в экономии токенов достигается не через промпты, а через специальные инструменты.
- Четыре стратегии работают с разных сторон: сокращение входящих и исходящих токенов, оптимизация внутренних процессов.
- Каждая стратегия имеет свои компромиссы, важно комбинировать их под конкретную задачу.
Стратегия 1: Индексирование кода (Code Graph)
Индексирование — это предварительное построение карты кода для быстрого поиска, аналогично работе поисковиков.
Как работает:
- Без индекса Claude Code сканирует файлы через
grep,glob,readдля каждого поиска, тратя много токенов. - Инструмент (например, Code Graph) создаёт локальную базу данных (граф) символов, вызовов функций, импортов.
- Поиск происходит мгновенно в графе, а не в файлах.
Результаты тестов:
- TypeScript (10k файлов): -70% токенов, -33% стоимости.
- Python (3k файлов): -70% токенов, -23% стоимости.
- В среднем: -57% токенов, -25% стоимости.
Нюансы:
- Граф нужно обновлять вручную командой
snпри изменениях в коде. - Может пропускать контекст из соседних
claude.mdфайлов. - Есть альтернативы с автоматической синхронизацией (сложнее в настройке).
Стратегия 2: Сжатие вывода (RTK Token Killer)
Инструмент RTK сокращает объём данных, которые Claude Code читает из терминала.
Принцип работы:
- Перехватывает вывод bash-команд (
grep,catи др.). - Применяет фильтры: убирает шум, группирует строки, обрезает лишнее, схлопывает повторы.
Результаты экономии:
- Команда
grep/rg: -80% токенов (с 16k до 3.2k). - Команда
cat: -70% токенов (с 40k до 12k). - За 30 минут сессии: ~80% экономии (с 11k до 24k токенов).
Компромисс: При сжатии теряются данные. Для задач отладки, где важен каждый лог, инструмент лучше отключать.
Стратегия 3: Сжатие ответов Claude (Cavman)
Инструмент Cavman заставляет Claude Code отвечать короче, сохраняя смысл.
Зачем это нужно: Каждый ответ Claude добавляется в историю и снова отправляется в модель для следующего запроса. Короткие ответы замедляют «раздувание» контекста.
Пример:
- Обычный ответ: 69 токенов.
- Ответ с Cavman: 19 токенов («Новая ссылка при каждом рендере → оберни в useMemo»).
Режимы работы:
light— убирает лишние слова.ultra— телеграфная речь (рекомендуется для рутинных задач).- Режимы для классического и китайского языков.
Результаты:
- Отладка бага в React: -87% токенов.
- Фикс авторизации: -83% токенов.
- В среднем: ~65% экономии исходящих токенов.
Компромисс: Меньше слов → меньше точность. Для сложного планирования нужен подробный ответ.
Стратегия 4: Встроенные практики Claude Code
Это базовые привычки, которые не требуют установки инструментов, но сильно экономят лимиты.
- Команда
context— показывает, что занимает место в контексте (например, огромныеclaude.mdфайлы или неиспользуемые MCP-серверы). Проведите аудит и удалите лишнее. - Команда
clear— очищайте контекст после завершения задачи. Не тащите историю предыдущей задачи в новую сессию. - Переключение моделей — используйте разные модели под задачи:
haiku— для навигации и простых изменений.sonnet— для средних задач.opus— для сложного планирования и архитектуры (на нём не экономьте).
- Режим планирования — активируется через
Shiftперед вводом задачи. План составляет дешёваяhaiku, а дорогие модели затем его выполняют, не сканируя код заново.
Выводы
- Для максимальной экономии комбинируйте инструменты: Code Graph (меньше обращений) + RTK (меньше данных за обращение) + Cavman (короче ответы).
- Каждый инструмент имеет компромисс: ручное обновление, потеря данных или точности.
- Управляемый расход = осознанный выбор, какие инструменты включать под конкретную задачу.
- Хаотичная архитектура проекта заставляет Claude «ходить по кругу» и тратить токены впустую. Хорошая структура экономит токены и упрощает поддержку проекта.