Mistral Large 2

Name: Mistral Large 2
Rating: 0.9 (5 reviews)
Author: Mistral AI

Mistral AI

Модель с 123 миллиардами параметров, обладающая сильными возможностями в генерации кода, математике и рассуждениях. Отличается улучшенной многоязычной поддержкой десятков языков, контекстным окном 128k и продвинутыми возможностями вызова функций. Превосходно следует инструкциям и обеспечивает краткие результаты.

Основные характеристики

Параметры

123.0B

Контекст

128.0K

Дата выпуска

24 июля 2024 г.

Средний балл

87.6%

API документация Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

24 июля 2024 г.

Последнее обновление

19 июля 2025 г.

Сегодня

6 февраля 2026 г.

Технические характеристики

Параметры

123.0B

Токены обучения

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$2.00

Выход (за 1М токенов)

$6.00

Макс. входящих токенов

128.0K

Макс. исходящих токенов

128.0K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание

MMLU

Точность В контексте оценки модели LLM точность относится к способности модели правильно отвечать на вопросы или решать задачи. Точность можно измерить, определив долю правильных ответов от общего числа заданных вопросов. В качестве критерия точности часто используется экспертная оценка, автоматизированная проверка или сравнение с опубликованными эталонными ответами. Точность является важным аспектом оценки, поскольку дает представление о том, насколько надежна модель при ответе на вопросы в определенной предметной области или в различных контекстах. Она помогает выявить сильные стороны и ограничения модели, а также определить области, требующие дальнейшего совершенствования. • Self-reported

84.0%

Программирование

Тесты на навыки программирования

HumanEval

Pass@1 Метод оценки Pass@1 измеряет процент задач, которые модель решает успешно с первой попытки. Это прямой показатель качества работы модели при единичном запросе без возможности исправления или множественных попыток. Данная метрика особенно важна для сценариев, где пользователи ожидают немедленного и точного ответа, или в случаях, когда повторные попытки невозможны из-за ограничений по времени, стоимости или архитектуры системы. При расчете Pass@1: • Модель получает задачу один раз • Генерирует одно решение • Решение оценивается как правильное или неправильное • Финальный показатель — процент правильных ответов из всех задач Высокий показатель Pass@1 указывает на надежность модели и ее способность находить верные решения без дополнительных итераций. Эта метрика часто используется в сравнительном анализе различных моделей для определения их базовой производительности. • Self-reported

92.0%

Математика

Математические задачи и вычисления

GSM8k

Точность AI-generated answers can sound plausible but still be incorrect. To measure how well LLMs can produce factually accurate answers, we can present them with test questions with known answers, and assess the percentage of their responses that are correct. Benchmarks: - General Knowledge: MMLU, a comprehensive test covering 57 subjects from STEM to humanities. - Advanced Knowledge: GPQA (Graduate-level Professional Questions & Answers), which tests expert-level knowledge. - Mathematical Reasoning: GSM8K for grade school math problems, and MATH for competition-level problems. This metric helps evaluate if models can reliably generate factual information rather than just producing coherent-sounding text. High accuracy suggests an LLM can be trusted to provide correct information within its training domain. • Self-reported

93.0%

Другие тесты

Специализированные бенчмарки

MMLU French

Точность AI: The model gave the correct answer. Человек: Модель дала правильный ответ. • Self-reported

82.8%

MT-Bench

Score Оценка • Self-reported

86.3%

Лицензия и метаданные

Лицензия

mistral_research_license

Дата анонса

24 июля 2024 г.

Последнее обновление

19 июля 2025 г.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Mistral Large 2

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Общие знания

Программирование

Математика

Другие тесты

Лицензия и метаданные

Похожие модели

Codestral-22B

GLM-4.7

DeepSeek-V2.5

Kimi K2-Thinking-0905

MiMo-V2-Flash

DeepSeek-V3.2 (Thinking)

DeepSeek-V3.2-Exp

Llama 3.1 405B Instruct