🤖 Тестирование Quen 3.6 Max Preview для веб-разработки

Тестирование Quen 3.6 Max Preview в веб-разработке

Ключевые тезисы:

Тестирование новой модели Quen 3.6 Max Preview на практических задачах по веб-кодингу.
Сравнение с предыдущими версиями Quen и моделью Claude Opus.
Результаты оказались неоднозначными и не всегда соответствовали заявленным в бенчмарках показателям.

Оценить практические возможности модели Quen 3.6 Max Preview в генерации кода для различных проектов: от простых 3D-сцен до игр и лендингов.

По официальным бенчмаркам модель позиционируется как превосходящая:

Однако автор отмечает, что реальные результаты часто не соответствуют заявленным в бенчмарках.

Задача: Сгенерировать интерактивную 3D-сцену с рыбками.

Процесс: Генерация была очень медленной. Модель допустила ошибки в коде (проблемы с импортами, необходимость запуска сервера).
Результаты после нескольких попыток:
- Рыбки отрисованы без хвостов и плавников.
- Отсутствуют растения.
- Странная геометрия камней.
- Есть анимация воды и пузырьков.
Итог: Задача выполнена неудовлетворительно. Многократные попытки исправить промптами не привели к успеху.

Задача: Создать простую 3D-модель мага.

Результат: Генерация прошла успешно.
Модель корректно отображается и имеет базовую анимацию (поднимает руки по нажатию пробела).
Итог: Вполне удачный результат для простого промпта.

Задача: Сгенерировать адаптивный лендинг с анимациями.

Результат:
- Страница сгенерирована, есть анимации (изменение цвета, движение элементов).
- Присутствует контактная форма и бургер-меню.
- Главная проблема: Крайне плохая адаптивная вёрстка на мобильных устройствах.
Итог: Стандартный, но не выдающийся результат для нейросетевой генерации фронтенда.

Задача: Создать простую браузерную игру.

Первая генерация: Динозаврик нарисован, но игра почти не играбельна: маленькие прыжки, невидимые препятствия, мешающий фон.
После попытки фикса: Декорации по-прежнему мешают обзору, логика прыжков неясна, камера изменилась без запроса.
Итог: Игра получилась отвратительной и неиграбельной.

Несоответствие бенчмаркам: Несмотря на высокие позиции в тестах, практические результаты Quen 3.6 Max оказались скромными.
Сильная зависимость от сложности задачи: Модель хорошо справилась с простыми промптами (3D маг), но провалила более комплексные (аквариум, игра).
Проблемы с контекстом и исполнением: Возможные причины неудач — генерация через чат-интерфейс, а не через специализированную IDE, что может приводить к ошибкам.
Сомнительный прогресс: По субъективной оценке, результат работы Quen 3.6 Max не сильно отличается или даже проигрывает предыдущей версии Quen 3.6+ в рамках тестируемых задач.
Гипотеза: Модель может быть лучше приспособлена для других типов задач, не затронутых в этом тестировании.