🤖 Claude Opus vs GPT-5: практический тест на креативность

Сравнение Claude Opus 4.7 и GPT-5.4: практический тест

Ключевые тезисы:

Тестирование двух топовых нейросетей (Claude Opus 4.7 и GPT-5.4) на креативных задачах с простыми промптами.
Claude показал лучшую понимаемость задачи, скорость и стабильность результатов.
GPT-5.4 часто неверно интерпретировал простые инструкции, совершал лишние действия и тратил ресурсы впустую.
Для эффективной работы с GPT-5.4 требуются детальные и точные промпты.

Условия тестирования

Модели: Claude Opus 4.7 и GPT-5.4 (обе с контекстом 1 млн токенов).
Доступ: Через платные подписки (проектные аккаунты по $20).
Задачи: Три креативных проекта с простыми, недетализированными промптами.
Критерии: Скорость выполнения, качество результата, эффективность использования токенов.

Тест 1: Создание персонажа (анимация в Space)

Claude Opus 4.7:
- Понял задачу с первого раза.
- Выполнил за 1 минуту 56 секунд.
- Создал персонажа с интересным визуальным эффектом (анимация вокруг посоха).
GPT-5.4:
- Изначально неверно интерпретировал задачу (переименовал файл).
- Совершал лишние действия: запускал playwright, делал скриншоты, перезапускал сервер.
- Потратил ~9% лимита (против ~4% у Claude) и больше времени.
- Результат похож, но анимация оценена как менее интересная.

Итог теста: Победа Claude по скорости, пониманию задачи и эстетике результата.

Тест 2: Создание игры (клон Chrome Dino)

Claude Opus 4.7:
- Справился за ~2 минуты.
- Создал играбельную игру в low-poly стиле с движущимся фоном, облаками, горами и декоративными элементами.
GPT-5.4:
- Выполнял задачу 11 минут 30 секунд.
- Снова переделывал работу с начала, тратил время впустую.
- Создал неиграбельный продукт: барьер для прыжка был слишком высоким и непреодолимым.

Итог теста: Полный провал GPT-5.4. Claude создал полноценную рабочую игру.

Тест 3: Создание лендинга

Claude Opus 4.7:
- Завершил за 2 минуты 47 секунд.
- Сделал простой, но приятный и адаптивный лендинг для продажи VIP-услуг с выбором бюджета.
GPT-5.4:
- Снова начал с создания ненужного файла (landing.md).
- Потребовалось дополнительное указание, чтобы создать нужный HTML-файл.
- Результат: «стрёмный» и нагромождённый дизайн, неприятный первый экран (хотя адаптивность была на уровне).

Итог теста: Claude сделал стабильный и аккуратный результат. GPT создал некачественный дизайн.

Общие наблюдения и выводы

Скорость и эффективность: Claude Opus 4.7 работает значительно быстрее и целенаправленнее. GPT-5.4 тратит много времени и токенов на лишние, нелогичные действия.
Понимание контекста: Claude демонстрирует превосходное понимание простых задач. GPT-5.4 часто тупит на простых промптах и требует детальных инструкций для адекватной работы.
Качество результата: По всем трём тестам Claude показал более стабильные и качественные результаты. GPT-5.4 может создавать нерабочие или эстетически неприятные продукты.
Расход токенов: Хотя GPT-5.4 иногда тратил меньший процент лимита, это происходило за счёт провала по качеству. Claude тратит токены результативнее.

Финальный вердикт: Claude Opus 4.7 одержал уверенную победу в этом практическом сравнении, показав себя как более умный, быстрый и надёжный инструмент для креативных задач с минимальным контролем.