Claude Fable 5: Первая публичная модель класса Myс
Ключевые тезисы:
- Claude Fable 5 — первая модель класса Myс, доступная широкой публике (ранее такие модели были только для избранных).
- Это не просто обновление, а качественный скачок, особенно в программировании, анализе и работе с длинным контекстом.
- До 22 июня 2026 года модель доступна для бесплатного тестирования подписчикам Pro и Max.
- После 22 июня модель перейдет на платную систему
usage credit, что может значительно увеличить стоимость для активных пользователей. - Полная версия без ограничений (Myс 5) доступна только по заявке для специалистов по кибербезопасности и биомедицинских исследований.
Что такое Claude Fable 5 и Myс 5?
- Claude Fable 5 — публичная версия модели с защитными ограничениями (Safeguards).
- Claude Myс 5 — та же модель, но со снятыми ограничениями в специфических областях (кибербезопасность, биомедицина). Доступна по заявке.
- Цена: $10 за 1 млн входных токенов, $50 за 1 млн выходных. Это в два раза дешевле, чем предшественник (Might Preview), но дороже, чем Opus 4.8.
Анализ бенчмарков: Где Fable 5 лидирует
Анализ 13 ключевых тестов от Anthropic. Fable 5 лидирует в 12 из них.
- SWE Bench Pro (программирование): 80% против 58% у GPT-5.5. Ключевой отрыв в исправлении реальных багов.
- Frontier Code / Agentic Coding: Решает в 2 раза больше сложных задач, чем Opus 4.8, и в 5 раз больше, чем GPT-5.5.
- Knowledge Work (аналитика): Значительный отрыв от конкурентов (на 42 пункта от Opus 4.8).
- Blueprint Bench (пространственное мышление): Сильный рост по сравнению с Opus 4.8.
- Exploit Bench (кибербезопасность): 78% найденных уязвимостей против 40% у Opus 4.8. Абсолютный лидер.
- Legal Agent Benchmark (юридические задачи): Опережает GPT-5.5 в 6 раз.
- Humanity Less Exam (междисциплинарные задачи): Лидер как в режиме с инструментами, так и без.
- Terminal Bench 2.1 (работа в терминале): 88% — очень высокий результат для агентного тестирования.
Важный нюанс: В тестах со звёздочкой (*) показаны результаты Myс 5 (без ограничений). Для Fable 5 с Safeguards результаты могут быть немного ниже.
Преимущества Fable 5
Прорыв в программировании: Отрыв в 20+ процентных пунктов на ключевых тестах.
Цена и качество: Мощнее Might Preview, но в два раза дешевле.
Превосходное зрение (Vision): Идеально работает с интерфейсами, скриншотами, документами и диаграммами.
Длинный контекст без потери фокуса: Возможность работы с целыми репозиториями и длинными исследованиями за один проход.
Окно для бесплатного тестирования: До 22 июня для подписчиков Pro/Max.
Недостатки и подводные камни
Переход на usage credit: После 22 июня счета для активных пользователей могут вырасти кратно.
Скрытый fallback на Opus 4.8: На "чувствительных" темах (кибербезопасность, биомедицина) ~5% запросов автоматически и незаметно для пользователя выполняет старая модель.
Myс 5 закрыта для всех: Полный потенциал модели доступен лишь узкому кругу.
Реактивный рынок: Конкуренты (OpenAI, Google) могут быстро выпустить ответные модели (ожидается GPT-5.6), сократив окно преимущества.
Практические кейсы для применения
Для разработчиков и технических специалистов:
- Аудит безопасности кода: Поиск RCE, SQL-инъекций, XSS, утечек секретов. Может заменить до 90% рутинной работы пентестера.
- Миграция Legacy-кода: Перевод больших объёмов кода между языками/фреймворками (пример: 50 млн строк Ruby за дни).
- Скриншот → Код: Генерация рабочего, адаптивного кода (React, TypeScript) по скриншоту Figma, сайта или дизайна.
- Поиск "плавающих" (flaky) тестов: Автономный анализ, выявление причины и написание патча.
Для бизнеса и аналитики:
5. UX-аудит сайта: Анализ лендингов, выявление проблем и предложение улучшений за 10 минут.
6. Финансовый разбор бизнеса по выпискам: Анализ P&L, поиск скрытых подписок, кассовых разрывов.
7. Проверка договоров на скрытые риски: Первичный анализ юридических документов (по заявлениям Anthropic, в слепых тестах модель иногда превосходила юристов).
8. Аналитика продаж по CRM: Поиск закономерностей в данных, прогнозирование, анализ причин отказов.
Реальный тест на продакшн-проекте
Тестирование проводилось на реальном лендинге futureai.ru.
Тест 1: Архитектурный аудит (длинный контекст)- Задача: Проанализировать весь репозиторий (100+ файлов) одним запросом.
- Результат: Модель успешно выявила три системные проблемы (дублирование логики, проблемы с деплоем, ошибки в рендеринге контента), дала детальное описание, оценку рисков и приоритизацию исправлений.
Тест 2: Боевой аудит безопасности (Security Audit)- Задача: Найти критические уязвимости (RCE, SQL-инъекции и т.д.) в продакшн-коде.
- Результат: Модель автоматически переключила запрос на Opus 4.8, сославшись на политики безопасности. Fable 5 отказалась выполнять задачу.
Выводы
- Claude Fable 5 — сильнейшая публично доступная модель для программирования и аналитики, подтверждённая тестами и реальными кейсами компаний (Stripe, Cursor, GitHub).
- Главный недостаток — жёсткие ограничения (Safeguards) в "чувствительных" областях, что может блокировать даже легитимные задачи (как показал security-аудит).
- Лучшее время для тестирования — прямо сейчас (до 22 июня), пока модель доступна в рамках подписки.
- Сила модели требует грамотного использования. Будущее за harness engineering (инженерией обвязок), а не просто за промт-инжинирингом.
Важный нюанс: В тестах со звёздочкой (*) показаны результаты Myс 5 (без ограничений). Для Fable 5 с Safeguards результаты могут быть немного ниже.