Сравнение Claude Opus 4.7 и GPT-5.4: практический тест
Ключевые тезисы:
- Тестирование двух топовых нейросетей (Claude Opus 4.7 и GPT-5.4) на креативных задачах с простыми промптами.
- Claude показал лучшую понимаемость задачи, скорость и стабильность результатов.
- GPT-5.4 часто неверно интерпретировал простые инструкции, совершал лишние действия и тратил ресурсы впустую.
- Для эффективной работы с GPT-5.4 требуются детальные и точные промпты.
Условия тестирования
- Модели: Claude Opus 4.7 и GPT-5.4 (обе с контекстом 1 млн токенов).
- Доступ: Через платные подписки (проектные аккаунты по $20).
- Задачи: Три креативных проекта с простыми, недетализированными промптами.
- Критерии: Скорость выполнения, качество результата, эффективность использования токенов.
Тест 1: Создание персонажа (анимация в Space)
- Claude Opus 4.7:
Понял задачу с первого раза.
Выполнил за 1 минуту 56 секунд.
Создал персонажа с интересным визуальным эффектом (анимация вокруг посоха).
- GPT-5.4:
Изначально неверно интерпретировал задачу (переименовал файл).
Совершал лишние действия: запускал playwright, делал скриншоты, перезапускал сервер.
Потратил ~9% лимита (против ~4% у Claude) и больше времени.
Результат похож, но анимация оценена как менее интересная.
Итог теста: Победа Claude по скорости, пониманию задачи и эстетике результата.
Тест 2: Создание игры (клон Chrome Dino)
- Claude Opus 4.7:
Справился за ~2 минуты.
Создал играбельную игру в low-poly стиле с движущимся фоном, облаками, горами и декоративными элементами.
- GPT-5.4:
Выполнял задачу 11 минут 30 секунд.
Снова переделывал работу с начала, тратил время впустую.
Создал неиграбельный продукт: барьер для прыжка был слишком высоким и непреодолимым.
Итог теста: Полный провал GPT-5.4. Claude создал полноценную рабочую игру.
Тест 3: Создание лендинга
- Claude Opus 4.7:
Завершил за 2 минуты 47 секунд.
Сделал простой, но приятный и адаптивный лендинг для продажи VIP-услуг с выбором бюджета.
- GPT-5.4:
Снова начал с создания ненужного файла (landing.md).
Потребовалось дополнительное указание, чтобы создать нужный HTML-файл.
Результат: «стрёмный» и нагромождённый дизайн, неприятный первый экран (хотя адаптивность была на уровне).
Итог теста: Claude сделал стабильный и аккуратный результат. GPT создал некачественный дизайн.
Общие наблюдения и выводы
Скорость и эффективность: Claude Opus 4.7 работает значительно быстрее и целенаправленнее. GPT-5.4 тратит много времени и токенов на лишние, нелогичные действия.
Понимание контекста: Claude демонстрирует превосходное понимание простых задач. GPT-5.4 часто тупит на простых промптах и требует детальных инструкций для адекватной работы.
Качество результата: По всем трём тестам Claude показал более стабильные и качественные результаты. GPT-5.4 может создавать нерабочие или эстетически неприятные продукты.
Расход токенов: Хотя GPT-5.4 иногда тратил меньший процент лимита, это происходило за счёт провала по качеству. Claude тратит токены результативнее.
Финальный вердикт:
Claude Opus 4.7 одержал уверенную победу в этом практическом сравнении, показав себя как более умный, быстрый и надёжный инструмент для креативных задач с минимальным контролем.