Mistral AI logo

Mistral Large 2

Mistral AI

Модель с 123 миллиардами параметров, обладающая сильными возможностями в генерации кода, математике и рассуждениях. Отличается улучшенной многоязычной поддержкой десятков языков, контекстным окном 128k и продвинутыми возможностями вызова функций. Превосходно следует инструкциям и обеспечивает краткие результаты.

Основные характеристики

Параметры
123.0B
Контекст
128.0K
Дата выпуска
24 июля 2024 г.
Средний балл
87.6%

Временная шкала

Ключевые даты в истории модели
Анонс
24 июля 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
123.0B
Токены обучения
-
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$2.00
Выход (за 1М токенов)
$6.00
Макс. входящих токенов
128.0K
Макс. исходящих токенов
128.0K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание
MMLU
Точность В контексте оценки модели LLM точность относится к способности модели правильно отвечать на вопросы или решать задачи. Точность можно измерить, определив долю правильных ответов от общего числа заданных вопросов. В качестве критерия точности часто используется экспертная оценка, автоматизированная проверка или сравнение с опубликованными эталонными ответами. Точность является важным аспектом оценки, поскольку дает представление о том, насколько надежна модель при ответе на вопросы в определенной предметной области или в различных контекстах. Она помогает выявить сильные стороны и ограничения модели, а также определить области, требующие дальнейшего совершенствования.Self-reported
84.0%

Программирование

Тесты на навыки программирования
HumanEval
Pass@1 Метод оценки Pass@1 измеряет процент задач, которые модель решает успешно с первой попытки. Это прямой показатель качества работы модели при единичном запросе без возможности исправления или множественных попыток. Данная метрика особенно важна для сценариев, где пользователи ожидают немедленного и точного ответа, или в случаях, когда повторные попытки невозможны из-за ограничений по времени, стоимости или архитектуры системы. При расчете Pass@1: • Модель получает задачу один раз • Генерирует одно решение • Решение оценивается как правильное или неправильное • Финальный показатель — процент правильных ответов из всех задач Высокий показатель Pass@1 указывает на надежность модели и ее способность находить верные решения без дополнительных итераций. Эта метрика часто используется в сравнительном анализе различных моделей для определения их базовой производительности.Self-reported
92.0%

Математика

Математические задачи и вычисления
GSM8k
Точность AI-generated answers can sound plausible but still be incorrect. To measure how well LLMs can produce factually accurate answers, we can present them with test questions with known answers, and assess the percentage of their responses that are correct. Benchmarks: - General Knowledge: MMLU, a comprehensive test covering 57 subjects from STEM to humanities. - Advanced Knowledge: GPQA (Graduate-level Professional Questions & Answers), which tests expert-level knowledge. - Mathematical Reasoning: GSM8K for grade school math problems, and MATH for competition-level problems. This metric helps evaluate if models can reliably generate factual information rather than just producing coherent-sounding text. High accuracy suggests an LLM can be trusted to provide correct information within its training domain.Self-reported
93.0%

Другие тесты

Специализированные бенчмарки
MMLU French
Точность AI: The model gave the correct answer. Человек: Модель дала правильный ответ.Self-reported
82.8%
MT-Bench
Score ОценкаSelf-reported
86.3%

Лицензия и метаданные

Лицензия
mistral_research_license
Дата анонса
24 июля 2024 г.
Последнее обновление
19 июля 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.