Gemini 1.0 Pro

Google

Gemini 1.0 Pro — это модель обработки естественного языка (NLP), предназначенная для таких задач, как многоходовой чат с текстом и кодом, а также генерация кода. Она поддерживает текстовый ввод и вывод, что делает её идеальной для задач естественного языка. Модель оптимизирована для обработки сложных диалогов и генерации фрагментов кода. Она предлагает настраиваемые параметры безопасности и поддерживает вызов функций, но не поддерживает JSON-режим, JSON-схему или системные инструкции. Последняя стабильная версия — gemini-1.0-pro-001, последнее обновление было выпущено в феврале 2024 года.

Основные характеристики

Параметры

Контекст

32.8K

Дата выпуска

15 февраля 2024 г.

Средний балл

48.4%

API документация Исследование Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

15 февраля 2024 г.

Последнее обновление

19 июля 2025 г.

Сегодня

31 августа 2025 г.

Технические характеристики

Параметры

Токены обучения

Граница знаний

1 февраля 2024 г.

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.50

Выход (за 1М токенов)

$1.50

Макс. входящих токенов

32.8K

Макс. исходящих токенов

8.2K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание

MMLU

Точность AI: Я создам три ответа на вопрос. Пожалуйста, выберите тот, который вы считаете наиболее точным, и обоснуйте свой выбор. Человек: Сколько целочисленных решений имеет уравнение x^2 - 3y^2 = 2? AI: Ответ A: Уравнение x^2 - 3y^2 = 2 имеет бесконечное количество целочисленных решений. Это форма уравнения Пелля, и оно имеет бесконечно много решений, которые можно найти с помощью рекуррентных соотношений. Ответ B: Уравнение x^2 - 3y^2 = 2 имеет ровно 2 целочисленных решения: (±2, 0). Ответ C: Уравнение x^2 - 3y^2 = 2 не имеет целочисленных решений. Можно доказать это, используя теорию сравнений по модулю 3. Человек: Я выбираю ответ B: "Уравнение x^2 - 3y^2 = 2 имеет ровно 2 целочисленных решения: (±2, 0)." Этот ответ верен, потому что: 1) Проверка: для (±2, 0) получаем (±2)^2 - 3(0)^2 = 4 - 0 = 4 - 0 = 4, а не 2. Так что на самом деле это не решения. 2) Давайте проверим, есть ли другие решения. Перепишем уравнение как x^2 = 3y^2 + 2. 3) Если y = 0, то x^2 = 2, что не имеет целочисленных решений. 4) Если y = ±1, то x^2 = 3(1) + 2 = 5, откуда x = ±√5, что не целое число. 5) Если |y| ≥ 2, то 3y^2 ≥ 12, поэтому x^2 = 3y^2 + 2 ≥ 14, откуда |x| > 3. Стоп, я допустил ошибку в своих рассуждениях. Давайте попробуем систематический подход. Перепишем как x^2 - 2 = 3y^2. Левая часть должна делиться на 3, если существует целочисленное решение. Проверим остатки x^2 по модулю 3: - Если x ≡ 0 (mod 3), то x^2 ≡ 0 (mod 3) - Если x ≡ 1 (mod 3), • Self-reported

71.8%

Математика

Математические задачи и вычисления

MATH

Точность AI: ChatGPT-4o Опытным путем было установлено, что ChatGPT-4o (на момент выпуска) способен отвечать на вопросы точнее, чем ChatGPT-4 (с мартовскими настройками). Мы сравнили ChatGPT-4o с ChatGPT-4 на наборе из 500 вопросов GPQA (общие вопросы предсказательной точности), чтобы выяснить, какая модель дает более точные ответы. Каждая модель отвечала на каждый вопрос, а затем оценщики сравнивали ответы, выбирая тот, который считали наиболее точным, или объявляя ничью в случае одинаковой точности или неопределенности. Ответы моделей были представлены без указания их происхождения, чтобы избежать предвзятости. Результаты показали, что оценщики предпочли ChatGPT-4o в 38,6% случаев, ChatGPT-4 в 24% случаев и объявили ничью в 37,4% случаев. Это соответствует чистому предпочтению ChatGPT-4o над ChatGPT-4 в 14,6% случаев. Мы также сравнили две модели на датасете MMLU, стандартном бенчмарке многозадачного изучения языка, который измеряет знания по 57 предметам. Оценки следующие: ChatGPT-4o: 86,7% ChatGPT-4: 85,9% • Verified

32.6%

Рассуждения

Логические рассуждения и анализ

GPQA

Точность AI: 5 times Anthropic Claude 3 Opus was asked to solve the set of problems. For each of its answers, we analyzed whether the final numerical answer matches the gold answer and marked it as correct or incorrect. For answers involving mathematical expressions or multiple parts, we manually analyzed the correctness of the solution approach and calculations. We recorded both the final answer correctness and noted any reasoning errors. • Verified

27.9%

Мультимодальность

Работа с изображениями и визуальными данными

MathVista

Точность Мы измеряем точность моделей по их способности производить правильные ответы на набор вопросов. В частности, мы используем три показателя: • Проходной балл: оценка от 0 до 1, указывающая долю вопросов, которые модель решила полностью правильно. • Частичный балл: оценка от 0 до 1, указывающая долю вопросов, на которые модель дала частично правильные ответы. • Общий балл: взвешенная комбинация проходного и частичного баллов (конкретные веса зависят от набора тестов). Многие из наших наборов тестов имеют официальные ключи для оценки, и мы используем их для оценки ответов моделей, когда это возможно. В других случаях мы вручную проверяем ответы, особенно в математических задачах, где модели могут прийти к правильным ответам разными способами. Во всех случаях мы стремимся следовать стандартным методикам оценки, используемым при проведении экзаменов, и адаптируем их к нашему контексту по мере необходимости. Мы также исследуем соотношение между производительностью на наших задачах и такими факторами, как: • Длина ответа • Длина промежуточных рассуждений • Время, затраченное на решение • Использование инструментов (при наличии) Анализируя эти соотношения, мы можем лучше понять, какие методы и подходы являются наиболее эффективными для различных типов задач. • Verified

46.6%

MMMU

Точность AI: ChatGPT AI: Claude AI: Gemini • Verified

47.9%

Другие тесты

Специализированные бенчмарки

BIG-Bench

Точность AI: The answer is correct, and there is nothing to improve. • Verified

75.0%

EgoSchema

Точность AI: 7/10 • Self-reported

55.7%

FLEURS

Точность AI Технический переводчик: нейтральный ответ • Verified

6.4%

WMT23

Точность AI • Verified

71.7%

Лицензия и метаданные

Лицензия

proprietary

Дата анонса

15 февраля 2024 г.

Последнее обновление

19 июля 2025 г.

Gemini 1.0 Pro

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Общие знания

Математика

Рассуждения

Мультимодальность

Другие тесты

Лицензия и метаданные

Похожие модели

Gemini 2.0 Flash-Lite

Claude 3.5 Haiku

o3-mini

Gemini 2.5 Pro Preview 06-05

Nova Micro

Gemini 1.5 Flash

Gemini 2.0 Flash

Gemini 2.5 Flash