Китайская компания Moonshot AI запустила рассуждающую версию своей языковой модели — Kimi K2-Thinking. По данным разработчика, она демонстрирует результаты на уровне или выше таких лидеров отрасли, как GPT‑5 от OpenAI и Claude Sonnet 4.5 от Anthropic.
Согласно опубликованным бенчмаркам, Kimi K2-Thinking заняла первое место в сложнейшем тесте Humanity’s Last Exam, включающем около трёх тысяч заданий по математике, а также естественным и гуманитарным дисциплинам. Модель смогла выполнить до 120 последовательных шагов рассуждения и корректно использовала внешние инструменты для решения задач.
Moonshot AI отмечает, что Kimi K2-Thinking умеет работать в расширенном режиме Heavy, где одновременно задействуется восемь экземпляров модели. Их ответы комбинируются в итоговый результат, что позволяет достичь уровня GPT‑5 Pro и Grok 4 Heavy. Этот режим недоступен в бесплатной версии чат-бота.
Модель можно протестировать в веб-версии Kimi после регистрации через Google-аккаунт. Для этого нужно выбрать K2 в списке доступных моделей и активировать функцию Thinking. При попытке входа через мобильное приложение может потребоваться подтверждение по SMS, но российские номера не принимаются.
Разработчик опубликовал открытый исходный код Kimi K2-Thinking на платформе Hugging Face. Модель содержит около одного триллиона параметров, при этом активно используется 32 миллиарда. Контекстное окно достигает 256 тысяч токенов, что позволяет работать с большими объёмами текста и выполнять многошаговые рассуждения.
