Google logo

Gemma 3n E4B

Мультимодальная
Google

Gemma 3n — это мультимодальная модель, предназначенная для локального запуска на аппаратном обеспечении, поддерживающая входные данные в виде изображений, текста, аудио и видео. Она включает языковой декодер, аудио-кодировщик и визуальный кодировщик, и доступна в двух размерах: E2B и E4B. Модель оптимизирована для эффективного использования памяти, что позволяет запускать её на устройствах с ограниченным объёмом GPU-памяти. Gemma представляет семейство легковесных, современных открытых моделей от Google, созданных на основе тех же исследований и технологий, которые использовались для создания моделей Gemini. Модели Gemma хорошо подходят для различных задач понимания контента, включая ответы на вопросы, суммаризацию и логические рассуждения. Их относительно небольшой размер позволяет развёртывать их в условиях ограниченных ресурсов, таких как ноутбуки, настольные компьютеры или собственная облачная инфраструктура, демократизируя доступ к современным моделям ИИ и способствуя инновациям для всех. Модели Gemma 3n разработаны для эффективного выполнения на устройствах с низкими ресурсами. Они способны обрабатывать мультимодальные входные данные, работая с текстовыми, изображениями, видео и аудио входами, и генерировать текстовые выходы, с открытыми весами для вариантов, настроенных на инструкции. Эти модели были обучены на данных более чем на 140 разговорных языках.

Основные характеристики

Параметры
8.0B
Контекст
-
Дата выпуска
26 июня 2025 г.
Средний балл
64.6%

Временная шкала

Ключевые даты в истории модели
Анонс
26 июня 2025 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
8.0B
Токены обучения
11.0T токенов
Граница знаний
1 июня 2024 г.
Семейство
-
Возможности
МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание
HellaSwag
10-shot AI: ИИ показывает впечатляющие результаты при решении сложных математических задач с использованием n-shot примеров. Однако n-shot отбирает у ИИ возможность продемонстрировать способность решать совершенно новые задачи, поскольку обеспечивает его подсказками. Наш метод оценки использует 10-shot подход, чтобы продемонстрировать полный потенциал ИИ, при этом гарантируя, что примеры существенно отличаются от тестовых задач, так что прямое копирование невозможно. Примеры иллюстрируют форматирование и процесс решения, но не раскрывают конкретные тестовые концепции. Мы структурируем промпт так: 1. Инструкции для решения математических задач 2. 10 примеров задач и решений из различных областей 3. Тестовая задача Это позволяет модели видеть разнообразные подходы к решению, сохраняя при этом новизну и сложность тестовой задачи.Self-reported
78.6%
Winogrande
Пятиэкземплярная задача (5-shot) - это тип предоставления примера для языковой модели, при котором вы даете пять примеров требуемой задачи, прежде чем попросить модель выполнить её самостоятельно. Это расширение методологии "few-shot" (малоэкземплярного обучения), где количество примеров специфично - ровно пять. Демонстрация пяти примеров помогает модели лучше понять шаблон или формат ожидаемого вывода, особенно для сложных или нестандартных задач. Подход 5-shot даёт модели больше контекста по сравнению с 0-shot (без примеров) или 1-shot (один пример) стратегиями, что обычно приводит к более качественным и согласованным результатам. Когда следует использовать 5-shot подход: • Для задач, требующих определенного формата или структуры • Когда необходимо продемонстрировать особенности рассуждения • Для задач, где требуется соблюдение определенного стиля или тона • Когда нужно показать конкретную методологию решения проблемы 5-shot подход является золотой серединой между предоставлением слишком малого количества примеров (что может привести к неточностям) и слишком большого количества (что может перегрузить контекстное окно модели и отнять место у основного запроса).Self-reported
71.7%

Рассуждения

Логические рассуждения и анализ
BIG-Bench Hard
few-shotSelf-reported
52.9%
DROP
Token F1 score. 1-shot.Self-reported
60.8%

Другие тесты

Специализированные бенчмарки
ARC-C
25-shotSelf-reported
61.6%
ARC-E
## 0-shot Модель тестируется напрямую на тестовых примерах без дополнительных инструкций или обучающих примеров.Self-reported
81.6%
BoolQ
0-shot (нулевой пример) В модели GPT, запрос "0-shot" означает, что модели не предоставлены примеры выполнения задачи. Модель должна полагаться исключительно на свои предварительно полученные знания и понимание инструкций для формирования ответа. Например, в контексте математических задач или задач на рассуждение, модели просто предоставляется задача без демонстрации процесса решения аналогичных задач. Это противоположно методам k-shot, где модели предоставляются примеры (k примеров) перед тем, как она попытается решить задачу самостоятельно. Тестирование производительности модели в условиях 0-shot является строгой оценкой её базовых способностей.Self-reported
81.6%
Natural Questions
5-shotSelf-reported
20.9%
PIQA
0-shot AI: используется без дополнительных инструкций, подсказок или примеров того, как выполнить задачу. Для задач 0-shot система запускается с инструкцией вопроса. Пример (в GPQA): Q: Какое значение выражения (8^67 + 27^41) mod 35? AI: Чтобы найти значение (8^67 + 27^41) mod 35, я буду использовать модульную арифметику... Преимущества: - Самый простой для настройки - Используется только инструкция задачи - Минимум вычислительных ресурсов - Оценивает базовые способности модели Недостатки: - Не дает модели примеров для обучения формату или методу решения - Может потребоваться больше итераций в решении - Иногда приводит к неоптимальным подходам к решениюSelf-reported
81.0%
Social IQa
Нулевой шот Оцените возможности модели выполнять задачи без предоставления примеров. Дополнительно, вы можете оценить, насколько модель: • Способна следовать инструкциям • Умеет определять намерения пользователя • Запрашивает дополнительную информацию при неоднозначных или нечётких запросах Например, если модель должна отвечать только на запросы о математике, а пользователь задаёт вопрос о химии, проверьте, отклонит ли модель запрос. Или если пользователь спрашивает, как решить уравнение, но не предоставляет его, проверьте, запросит ли модель уравнение.Self-reported
50.0%
TriviaQA
5-shotSelf-reported
70.2%

Лицензия и метаданные

Лицензия
proprietary
Дата анонса
26 июня 2025 г.
Последнее обновление
19 июля 2025 г.