Сравнение нейросетей для генерации кода: DeepSeek V4 Pro, Mixtral 8x22B (Mimo) и Kimi
Ключевые тезисы
- Тестирование трёх моделей (DeepSeek V4 Pro, Mixtral 8x22B, Kimi) на трёх задачах: дашборд, симуляция террариума, космическая игра.
- Критерии: скорость выполнения, расход токенов, качество и работоспособность кода.
- Kimi показал наиболее стабильные и качественные результаты, но был самым медленным.
- Mixtral (Mimo) был самым быстрым, но менее стабильным.
- DeepSeek V4 Pro занял последнее место по итогам тестов.
Тестовые задачи
- Дашборд — создание адаптивного дашборда с ценами по странам.
- Террариум — симуляция жизни муравьёв с механиками добычи ресурсов.
- Космическая игра — игра с волнами врагов, разным оружием и управлением.
Технические параметры и стоимость
| Модель |
Контекст |
Цена (за 1M токенов) |
Способ доступа |
| Kimi |
256K |
$0.12 (Output) |
Подписка |
| Mixtral 8x22B (Mimo) |
1M |
$0.65 (Output) |
OpenRouter |
| DeepSeek V4 Pro |
1M |
$0.28 (Output) |
Официальный сайт |
Результаты тестирования
Задача 1: Дашборд
- Все модели справились хорошо, создали рабочий и адаптивный фронтенд.
- Качество результатов было примерно одинаковым у всех.
- Скорость: Mimo (самый быстрый) → Kimi (средний) → DeepSeek (самый медленный).
Задача 2: Террариум (симуляция муравьёв)
- Kimi: Сделал наиболее рабочую симуляцию. Муравьи выполняли базовые действия (носили еду, воду, следили за яйцами), хотя и с багами. После доработки по промту стал работать лучше всех.
- Mimo: После доработки симуляция сломалась — игра зависала, логика не работала.
- DeepSeek: Симуляция осталась нерабочей. Муравьи не реагировали на нехватку ресурсов, механики не были реализованы.
Задача 3: Космическая игра
- Mimo: Создал полноценную игру с волнами врагов, сменой оружия, разными типами противников. Управление удобное.
- Kimi: Игра рабочая, но менее интересная (всё оружие доступно сразу, низкая сложность из-за медленного корабля).
- DeepSeek: Игра не доделана. Управление крайне неудобное, отсутствуют непрерывные волны врагов (только 2 волны).
Итоговая таблица результатов
| Модель |
Дашборд |
Террариум |
Космическая игра |
Итог |
| Kimi |
Хорошо |
Лучший (рабочая логика) |
Рабочая, но простая |
1 место |
| Mimo |
Хорошо |
Сломал после доработки |
Лучшая (полноценная игра) |
2 место |
| DeepSeek |
Хорошо |
Не работает |
Не доделана (нет волн, плохое управление) |
3 место |
Выводы
- Kimi — самая стабильная и предсказуемая модель. Даёт качественный результат, но работает дольше всех.
- Mixtral (Mimo) — самая быстрая, но менее стабильная. Может хорошо справиться с задачей, а может выдать нерабочий код.
- DeepSeek V4 Pro в данном тесте показал наихудшие результаты по двум из трёх задач, уступив конкурентам.
Рекомендация: Для сложных и последовательных задач, где важна надёжность (как симуляция), лучше выбрать Kimi. Для быстрого прототипирования более простых вещей может подойти Mimo.