Тестирование Quen 3.6 Max Preview в веб-разработке
Ключевые тезисы:
- Тестирование новой модели Quen 3.6 Max Preview на практических задачах по веб-кодингу.
- Сравнение с предыдущими версиями Quen и моделью Claude Opus.
- Результаты оказались неоднозначными и не всегда соответствовали заявленным в бенчмарках показателям.
Цель тестирования
Оценить практические возможности модели Quen 3.6 Max Preview в генерации кода для различных проектов: от простых 3D-сцен до игр и лендингов.
Сравнение с конкурентами
По официальным бенчмаркам модель позиционируется как превосходящая:
- Собственные предыдущие версии (Quen 3.6+, 3.5+).
- Модель Claude Opus 4.5 (но не более свежие версии 4.6/4.7).
- Модель GLM 5.1.
Однако автор отмечает, что реальные результаты часто не соответствуют заявленным в бенчмарках.
Практические тесты и результаты
Аквариум с рыбками
Задача: Сгенерировать интерактивную 3D-сцену с рыбками.
- Процесс: Генерация была очень медленной. Модель допустила ошибки в коде (проблемы с импортами, необходимость запуска сервера).
- Результаты после нескольких попыток:
- Рыбки отрисованы без хвостов и плавников.
- Отсутствуют растения.
- Странная геометрия камней.
- Есть анимация воды и пузырьков.
- Итог: Задача выполнена неудовлетворительно. Многократные попытки исправить промптами не привели к успеху.
3D Маг (Low Poly)
Задача: Создать простую 3D-модель мага.
- Результат:
Генерация прошла успешно. - Модель корректно отображается и имеет базовую анимацию (поднимает руки по нажатию пробела).
- Итог: Вполне удачный результат для простого промпта.
Лендинг-страница
Задача: Сгенерировать адаптивный лендинг с анимациями.
- Результат:
- Страница сгенерирована, есть анимации (изменение цвета, движение элементов).
- Присутствует контактная форма и бургер-меню.
- Главная проблема:
Крайне плохая адаптивная вёрстка на мобильных устройствах.
- Итог: Стандартный, но не выдающийся результат для нейросетевой генерации фронтенда.
Игра (Аналог Google Dino)
Задача: Создать простую браузерную игру.
- Первая генерация: Динозаврик нарисован, но игра почти не играбельна: маленькие прыжки, невидимые препятствия, мешающий фон.
- После попытки фикса: Декорации по-прежнему мешают обзору, логика прыжков неясна, камера изменилась без запроса.
- Итог:
Игра получилась отвратительной и неиграбельной.
Общие выводы
- Несоответствие бенчмаркам: Несмотря на высокие позиции в тестах, практические результаты Quen 3.6 Max оказались скромными.
- Сильная зависимость от сложности задачи: Модель хорошо справилась с простыми промптами (3D маг), но провалила более комплексные (аквариум, игра).
- Проблемы с контекстом и исполнением: Возможные причины неудач — генерация через чат-интерфейс, а не через специализированную IDE, что может приводить к ошибкам.
- Сомнительный прогресс: По субъективной оценке, результат работы Quen 3.6 Max не сильно отличается или даже проигрывает предыдущей версии Quen 3.6+ в рамках тестируемых задач.
Гипотеза: Модель может быть лучше приспособлена для других типов задач, не затронутых в этом тестировании.