Этот конспект не сохранится

Закроешь вкладку — потеряешь. Зарегистрируйся — и он будет в библиотеке навсегда.

Telegram

Ваш конспект

YouTubeОбзор Fable 5: 8 кейсов использования и тест на реальном проекте. Новый король ИИ? НЕТ!

🚀 Claude Fable 5: Первая публичная модель класса Myс

Ключевые тезисы:

  • Claude Fable 5 — первая модель класса Myс, доступная широкой публике (ранее такие модели были только для избранных).
  • Это не просто обновление, а качественный скачок, особенно в программировании, анализе и работе с длинным контекстом.
  • До 22 июня 2026 года модель доступна для бесплатного тестирования подписчикам Pro и Max.
  • После 22 июня модель перейдет на платную систему usage credit, что может значительно увеличить стоимость для активных пользователей.
  • Полная версия без ограничений (Myс 5) доступна только по заявке для специалистов по кибербезопасности и биомедицинских исследований.

🎯 Что такое Claude Fable 5 и Myс 5?

  • Claude Fable 5 — публичная версия модели с защитными ограничениями (Safeguards).
  • Claude Myс 5 — та же модель, но со снятыми ограничениями в специфических областях (кибербезопасность, биомедицина). Доступна по заявке.
  • Цена: $10 за 1 млн входных токенов, $50 за 1 млн выходных. Это в два раза дешевле, чем предшественник (Might Preview), но дороже, чем Opus 4.8.

📊 Анализ бенчмарков: Где Fable 5 лидирует

Анализ 13 ключевых тестов от Anthropic. Fable 5 лидирует в 12 из них.

  • SWE Bench Pro (программирование): 80% против 58% у GPT-5.5. Ключевой отрыв в исправлении реальных багов.
  • Frontier Code / Agentic Coding: Решает в 2 раза больше сложных задач, чем Opus 4.8, и в 5 раз больше, чем GPT-5.5.
  • Knowledge Work (аналитика): Значительный отрыв от конкурентов (на 42 пункта от Opus 4.8).
  • Blueprint Bench (пространственное мышление): Сильный рост по сравнению с Opus 4.8.
  • Exploit Bench (кибербезопасность): 78% найденных уязвимостей против 40% у Opus 4.8. Абсолютный лидер.
  • Legal Agent Benchmark (юридические задачи): Опережает GPT-5.5 в 6 раз.
  • Humanity Less Exam (междисциплинарные задачи): Лидер как в режиме с инструментами, так и без.
  • Terminal Bench 2.1 (работа в терминале): 88% — очень высокий результат для агентного тестирования.

⚠️ Важный нюанс: В тестах со звёздочкой (*) показаны результаты Myс 5 (без ограничений). Для Fable 5 с Safeguards результаты могут быть немного ниже.

✅ Преимущества Fable 5

  1. 🔥 Прорыв в программировании: Отрыв в 20+ процентных пунктов на ключевых тестах.
  2. 💰 Цена и качество: Мощнее Might Preview, но в два раза дешевле.
  3. 👁️ Превосходное зрение (Vision): Идеально работает с интерфейсами, скриншотами, документами и диаграммами.
  4. 🧠 Длинный контекст без потери фокуса: Возможность работы с целыми репозиториями и длинными исследованиями за один проход.
  5. 🆓 Окно для бесплатного тестирования: До 22 июня для подписчиков Pro/Max.

❌ Недостатки и подводные камни

  1. 💸 Переход на usage credit: После 22 июня счета для активных пользователей могут вырасти кратно.
  2. 🛡️ Скрытый fallback на Opus 4.8: На "чувствительных" темах (кибербезопасность, биомедицина) ~5% запросов автоматически и незаметно для пользователя выполняет старая модель.
  3. 🔒 Myс 5 закрыта для всех: Полный потенциал модели доступен лишь узкому кругу.
  4. ⚡ Реактивный рынок: Конкуренты (OpenAI, Google) могут быстро выпустить ответные модели (ожидается GPT-5.6), сократив окно преимущества.

💡 Практические кейсы для применения

Для разработчиков и технических специалистов:

  1. Аудит безопасности кода: Поиск RCE, SQL-инъекций, XSS, утечек секретов. Может заменить до 90% рутинной работы пентестера.
  2. Миграция Legacy-кода: Перевод больших объёмов кода между языками/фреймворками (пример: 50 млн строк Ruby за дни).
  3. Скриншот → Код: Генерация рабочего, адаптивного кода (React, TypeScript) по скриншоту Figma, сайта или дизайна.
  4. Поиск "плавающих" (flaky) тестов: Автономный анализ, выявление причины и написание патча.

Для бизнеса и аналитики:
5. UX-аудит сайта: Анализ лендингов, выявление проблем и предложение улучшений за 10 минут.
6. Финансовый разбор бизнеса по выпискам: Анализ P&L, поиск скрытых подписок, кассовых разрывов.
7. Проверка договоров на скрытые риски: Первичный анализ юридических документов (по заявлениям Anthropic, в слепых тестах модель иногда превосходила юристов).
8. Аналитика продаж по CRM: Поиск закономерностей в данных, прогнозирование, анализ причин отказов.

🔍 Реальный тест на продакшн-проекте

Тестирование проводилось на реальном лендинге futureai.ru.

  • ✅ Тест 1: Архитектурный аудит (длинный контекст)

    • Задача: Проанализировать весь репозиторий (100+ файлов) одним запросом.
    • Результат: Модель успешно выявила три системные проблемы (дублирование логики, проблемы с деплоем, ошибки в рендеринге контента), дала детальное описание, оценку рисков и приоритизацию исправлений.
  • ❌ Тест 2: Боевой аудит безопасности (Security Audit)

    • Задача: Найти критические уязвимости (RCE, SQL-инъекции и т.д.) в продакшн-коде.
    • Результат: Модель автоматически переключила запрос на Opus 4.8, сославшись на политики безопасности. Fable 5 отказалась выполнять задачу.

🎯 Выводы

  1. Claude Fable 5 — сильнейшая публично доступная модель для программирования и аналитики, подтверждённая тестами и реальными кейсами компаний (Stripe, Cursor, GitHub).
  2. Главный недостаток — жёсткие ограничения (Safeguards) в "чувствительных" областях, что может блокировать даже легитимные задачи (как показал security-аудит).
  3. Лучшее время для тестирования — прямо сейчас (до 22 июня), пока модель доступна в рамках подписки.
  4. Сила модели требует грамотного использования. Будущее за harness engineering (инженерией обвязок), а не просто за промт-инжинирингом.
🤖 Claude Fable 5: Прорывная модель для разработки и анали... — конспект на EchoNote