Google logo

Gemini 1.0 Pro

Google

Gemini 1.0 Pro — это модель обработки естественного языка (NLP), предназначенная для таких задач, как многоходовой чат с текстом и кодом, а также генерация кода. Она поддерживает текстовый ввод и вывод, что делает её идеальной для задач естественного языка. Модель оптимизирована для обработки сложных диалогов и генерации фрагментов кода. Она предлагает настраиваемые параметры безопасности и поддерживает вызов функций, но не поддерживает JSON-режим, JSON-схему или системные инструкции. Последняя стабильная версия — gemini-1.0-pro-001, последнее обновление было выпущено в феврале 2024 года.

Основные характеристики

Параметры
-
Контекст
32.8K
Дата выпуска
15 февраля 2024 г.
Средний балл
48.4%

Временная шкала

Ключевые даты в истории модели
Анонс
15 февраля 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
-
Токены обучения
-
Граница знаний
1 февраля 2024 г.
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$0.50
Выход (за 1М токенов)
$1.50
Макс. входящих токенов
32.8K
Макс. исходящих токенов
8.2K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание
MMLU
Точность AI: Я создам три ответа на вопрос. Пожалуйста, выберите тот, который вы считаете наиболее точным, и обоснуйте свой выбор. Человек: Сколько целочисленных решений имеет уравнение x^2 - 3y^2 = 2? AI: Ответ A: Уравнение x^2 - 3y^2 = 2 имеет бесконечное количество целочисленных решений. Это форма уравнения Пелля, и оно имеет бесконечно много решений, которые можно найти с помощью рекуррентных соотношений. Ответ B: Уравнение x^2 - 3y^2 = 2 имеет ровно 2 целочисленных решения: (±2, 0). Ответ C: Уравнение x^2 - 3y^2 = 2 не имеет целочисленных решений. Можно доказать это, используя теорию сравнений по модулю 3. Человек: Я выбираю ответ B: "Уравнение x^2 - 3y^2 = 2 имеет ровно 2 целочисленных решения: (±2, 0)." Этот ответ верен, потому что: 1) Проверка: для (±2, 0) получаем (±2)^2 - 3(0)^2 = 4 - 0 = 4 - 0 = 4, а не 2. Так что на самом деле это не решения. 2) Давайте проверим, есть ли другие решения. Перепишем уравнение как x^2 = 3y^2 + 2. 3) Если y = 0, то x^2 = 2, что не имеет целочисленных решений. 4) Если y = ±1, то x^2 = 3(1) + 2 = 5, откуда x = ±√5, что не целое число. 5) Если |y| ≥ 2, то 3y^2 ≥ 12, поэтому x^2 = 3y^2 + 2 ≥ 14, откуда |x| > 3. Стоп, я допустил ошибку в своих рассуждениях. Давайте попробуем систематический подход. Перепишем как x^2 - 2 = 3y^2. Левая часть должна делиться на 3, если существует целочисленное решение. Проверим остатки x^2 по модулю 3: - Если x ≡ 0 (mod 3), то x^2 ≡ 0 (mod 3) - Если x ≡ 1 (mod 3),Self-reported
71.8%

Математика

Математические задачи и вычисления
MATH
Точность AI: ChatGPT-4o Опытным путем было установлено, что ChatGPT-4o (на момент выпуска) способен отвечать на вопросы точнее, чем ChatGPT-4 (с мартовскими настройками). Мы сравнили ChatGPT-4o с ChatGPT-4 на наборе из 500 вопросов GPQA (общие вопросы предсказательной точности), чтобы выяснить, какая модель дает более точные ответы. Каждая модель отвечала на каждый вопрос, а затем оценщики сравнивали ответы, выбирая тот, который считали наиболее точным, или объявляя ничью в случае одинаковой точности или неопределенности. Ответы моделей были представлены без указания их происхождения, чтобы избежать предвзятости. Результаты показали, что оценщики предпочли ChatGPT-4o в 38,6% случаев, ChatGPT-4 в 24% случаев и объявили ничью в 37,4% случаев. Это соответствует чистому предпочтению ChatGPT-4o над ChatGPT-4 в 14,6% случаев. Мы также сравнили две модели на датасете MMLU, стандартном бенчмарке многозадачного изучения языка, который измеряет знания по 57 предметам. Оценки следующие: ChatGPT-4o: 86,7% ChatGPT-4: 85,9%Verified
32.6%

Рассуждения

Логические рассуждения и анализ
GPQA
Точность AI: 5 times Anthropic Claude 3 Opus was asked to solve the set of problems. For each of its answers, we analyzed whether the final numerical answer matches the gold answer and marked it as correct or incorrect. For answers involving mathematical expressions or multiple parts, we manually analyzed the correctness of the solution approach and calculations. We recorded both the final answer correctness and noted any reasoning errors.Verified
27.9%

Мультимодальность

Работа с изображениями и визуальными данными
MathVista
Точность Мы измеряем точность моделей по их способности производить правильные ответы на набор вопросов. В частности, мы используем три показателя: • Проходной балл: оценка от 0 до 1, указывающая долю вопросов, которые модель решила полностью правильно. • Частичный балл: оценка от 0 до 1, указывающая долю вопросов, на которые модель дала частично правильные ответы. • Общий балл: взвешенная комбинация проходного и частичного баллов (конкретные веса зависят от набора тестов). Многие из наших наборов тестов имеют официальные ключи для оценки, и мы используем их для оценки ответов моделей, когда это возможно. В других случаях мы вручную проверяем ответы, особенно в математических задачах, где модели могут прийти к правильным ответам разными способами. Во всех случаях мы стремимся следовать стандартным методикам оценки, используемым при проведении экзаменов, и адаптируем их к нашему контексту по мере необходимости. Мы также исследуем соотношение между производительностью на наших задачах и такими факторами, как: • Длина ответа • Длина промежуточных рассуждений • Время, затраченное на решение • Использование инструментов (при наличии) Анализируя эти соотношения, мы можем лучше понять, какие методы и подходы являются наиболее эффективными для различных типов задач.Verified
46.6%
MMMU
Точность AI: ChatGPT AI: Claude AI: GeminiVerified
47.9%

Другие тесты

Специализированные бенчмарки
BIG-Bench
Точность AI: The answer is correct, and there is nothing to improve.Verified
75.0%
EgoSchema
Точность AI: 7/10Self-reported
55.7%
FLEURS
Точность AI Технический переводчик: нейтральный ответVerified
6.4%
WMT23
Точность AIVerified
71.7%

Лицензия и метаданные

Лицензия
proprietary
Дата анонса
15 февраля 2024 г.
Последнее обновление
19 июля 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.