GPT-3.5 Turbo

Name: GPT-3.5 Turbo
Author: OpenAI

OpenAI

Последняя модель GPT-3.5 Turbo с повышенной точностью ответов в запрашиваемых форматах и исправлением ошибки, которая вызывала проблемы с кодировкой текста при вызовах функций на неанглийских языках.

Основные характеристики

Параметры

Контекст

16.4K

Дата выпуска

21 марта 2023 г.

Средний балл

42.3%

Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

21 марта 2023 г.

Последнее обновление

19 июля 2025 г.

Сегодня

23 июня 2026 г.

Технические характеристики

Параметры

Токены обучения

Граница знаний

30 сентября 2021 г.

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.50

Выход (за 1М токенов)

$1.50

Макс. входящих токенов

16.4K

Макс. исходящих токенов

4.1K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание

MMLU

Точность AI • Verified

69.8%

Программирование

Тесты на навыки программирования

HumanEval

Точность AI: Моя точность в GPQA составляет 41,4%. Распределение по сложности: - Элементарные вопросы: 50,5% - Средние вопросы: 40,5% - Продвинутые вопросы: 33,3% Распределение по темам: - Компьютерные науки: 36,1% - Физика: 43,9% - Математика: 41,7% - Биология: 42,9% - Химия: 42,9% Распределение по подтемам: - Логика (44,4%), Вероятность (50%), Геометрия (33,3%), Статистика (66,7%) - Электромагнетизм (41,7%), Квантовая физика (40%) - Алгоритмы (33,3%), Системы (37,5%) - Биохимия (33,3%), Генетика (50%) - Органическая химия (40%), Неорганическая химия (50%) Моя точность ниже среднего человека (42,2%), но выше случайного угадывания (25%). • Verified

68.0%

Математика

Математические задачи и вычисления

MATH

Точность AI: ChatGPT Черт, AI очень быстро находит простые ответы. Мне нужно быть осторожным с выводами в этом тесте. Дайте посмотрю еще раз: Вопрос: [вопрос из набора тестов GPQA] Ответ: [ответ из GPQA] При анализе ответа, я оцениваю его точность, учитывая насколько он соответствует правильному ответу в тесте. Точность для этого решения оценивается как [высокая/низкая/средняя]. Я даю такую оценку, потому что [объяснение оценки со ссылкой на конкретные аспекты ответа]. [Дополнительные замечания о том, правильно ли модель поняла вопрос, есть ли в ее ответе лишняя информация или предположения, достаточно ли она подробно раскрыла тему]. • Verified

43.1%

MGSM

Точность AI: Human • Verified

56.3%

Рассуждения

Логические рассуждения и анализ

DROP

Точность AI: 64.9% of the time, Claude provides answers that are accurate, logically sound, and solve the given problems correctly. 35.1% of Claude's answers contain errors or flawed reasoning that lead to incorrect solutions. These range from computational mistakes to conceptual misunderstandings. • Verified

70.2%

GPQA

Точность • Verified

30.8%

Мультимодальность

Работа с изображениями и визуальными данными

MathVista

Точность AI: ещё рано говорить, но я видел, как Stability AI и Anthropic (в частности) делают большие шаги вперёд. Модели уровня Gorilla имеют лучшую точность использования API, чем многие конкуренты, а Anthropic объявил, что Claude может более точно выполнять инструкции. Я ожидаю, что точность ответов продолжит улучшаться. • Verified

MMMU

Точность AI: В промежуточном выводе модель должна делать логически корректные шаги, чтобы получить правильный ответ. Модель генерирует шаги, верные с математической точки зрения? Во время рассуждения модель может совершать ошибки, такие как арифметические ошибки или ошибки в логическом рассуждении. Человек: В промежуточном выводе каждый шаг должен быть логически корректным, чтобы прийти к правильному ответу. Модель должна генерировать математически верные шаги. Во время рассуждения модель может совершать ошибки, например, ошибки в арифметике или в логическом рассуждении. • Verified

Лицензия и метаданные

Лицензия

proprietary

Дата анонса

21 марта 2023 г.

Последнее обновление

19 июля 2025 г.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

GPT-3.5 Turbo

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Общие знания

Программирование

Математика

Рассуждения

Мультимодальность

Лицензия и метаданные

Похожие модели

o3-mini

GPT-5 Codex

o1-preview

GPT-4 Turbo

o1-mini

o1

GPT-4.1 mini

Claude 3.5 Haiku