Moonshot AI logo

Kimi K2-Instruct-0905

Moonshot AI

Kimi K2-Instruct-0905 — это последняя, самая мощная версия Kimi K2, достигающая лучшей в своем классе производительности в передовых знаниях, математике и программировании среди моделей без мышления. Эта модель Mixture-of-Experts имеет 32 миллиарда активных параметров и 1 триллион параметров, тщательно оптимизированных для агентных задач. Ключевые особенности включают улучшенный интеллект агентного программирования, расширенную длину контекста до 256K токенов и гибридную архитектуру, обученную с помощью оптимизатора MuonClip на 15.5T токенах. Модель достигает 65.8% на SWE-bench Verified (одна попытка), 47.3% на SWE-bench Multilingual и превосходно использует инструменты с 70.6% на Tau2-retail. Это рефлекторная модель без длительного мышления, разработанная для действия и выполнения сложных задач.

Основные характеристики

Параметры
1.0T
Контекст
262.1K
Дата выпуска
5 сентября 2025 г.
Средний балл
64.1%

Временная шкала

Ключевые даты в истории модели
Анонс
5 сентября 2025 г.
Последнее обновление
15 сентября 2025 г.
Сегодня
26 октября 2025 г.

Технические характеристики

Параметры
1.0T
Токены обучения
15.5T токенов
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$0.60
Выход (за 1М токенов)
$2.50
Макс. входящих токенов
262.1K
Макс. исходящих токенов
262.1K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание
Mmlu
EMSelf-reported
89.5%

Программирование

Тесты на навыки программирования
Swe Bench Verified
Agentic Coding - Single AttemptSelf-reported
65.8%

Рассуждения

Логические рассуждения и анализ
Gpqa
Diamond - Avg@8Self-reported
75.1%

Другие тесты

Специализированные бенчмарки
Swe Bench Multilingual
Agentic Coding - Single AttemptSelf-reported
47.3%
Terminal Bench
TerminusSelf-reported
25.0%
Livecodebench
v6 (Aug 24-May 25) Pass@1Self-reported
53.7%
Ojbench
Pass@1Self-reported
27.1%
Multiple
Pass@1Self-reported
85.7%
Aider Polyglot
AccuracySelf-reported
60.0%
Tau2 Retail
Avg@4Self-reported
70.6%
Tau2 Airline
Avg@4Self-reported
56.5%
Tau2 Telecom
Avg@4Self-reported
65.8%
Acebench
AccuracySelf-reported
76.5%
Aime 2024
Avg@64Self-reported
69.6%
Aime 2025
Avg@64Self-reported
49.5%
Math 500
AccuracySelf-reported
97.4%
Hmmt 2025
Avg@32Self-reported
38.8%
Cnmo 2024
Avg@16Self-reported
74.3%
Polymath En
Avg@4Self-reported
65.1%
Zebralogic
AccuracySelf-reported
89.0%
Autologi
AccuracySelf-reported
89.5%
Supergpqa
AccuracySelf-reported
57.2%
Hle
Text OnlySelf-reported
4.7%
Mmlu Redux
EMSelf-reported
92.7%
Mmlu Pro
EMSelf-reported
81.1%
Ifeval
Prompt StrictSelf-reported
89.8%
Multichallenge
AccuracySelf-reported
54.1%
Simpleqa
CorrectSelf-reported
31.0%
Livebench
2024/11/25 Pass@1Self-reported
76.4%

Лицензия и метаданные

Лицензия
mit
Дата анонса
5 сентября 2025 г.
Последнее обновление
15 сентября 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.