Gemma 3n E4B

Name: Gemma 3n E4B
Author: Google

Мультимодальная

Google

Gemma 3n — это мультимодальная модель, предназначенная для локального запуска на аппаратном обеспечении, поддерживающая входные данные в виде изображений, текста, аудио и видео. Она включает языковой декодер, аудио-кодировщик и визуальный кодировщик, и доступна в двух размерах: E2B и E4B. Модель оптимизирована для эффективного использования памяти, что позволяет запускать её на устройствах с ограниченным объёмом GPU-памяти. Gemma представляет семейство легковесных, современных открытых моделей от Google, созданных на основе тех же исследований и технологий, которые использовались для создания моделей Gemini. Модели Gemma хорошо подходят для различных задач понимания контента, включая ответы на вопросы, суммаризацию и логические рассуждения. Их относительно небольшой размер позволяет развёртывать их в условиях ограниченных ресурсов, таких как ноутбуки, настольные компьютеры или собственная облачная инфраструктура, демократизируя доступ к современным моделям ИИ и способствуя инновациям для всех. Модели Gemma 3n разработаны для эффективного выполнения на устройствах с низкими ресурсами. Они способны обрабатывать мультимодальные входные данные, работая с текстовыми, изображениями, видео и аудио входами, и генерировать текстовые выходы, с открытыми весами для вариантов, настроенных на инструкции. Эти модели были обучены на данных более чем на 140 разговорных языках.

Основные характеристики

Параметры

8.0B

Контекст

Дата выпуска

26 июня 2025 г.

Средний балл

64.6%

API документация Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

26 июня 2025 г.

Последнее обновление

19 июля 2025 г.

Сегодня

22 июня 2026 г.

Технические характеристики

Параметры

8.0B

Токены обучения

11.0T токенов

Граница знаний

1 июня 2024 г.

Семейство

Возможности

МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Общие знания

Тесты на общие знания и понимание

HellaSwag

10-shot AI: ИИ показывает впечатляющие результаты при решении сложных математических задач с использованием n-shot примеров. Однако n-shot отбирает у ИИ возможность продемонстрировать способность решать совершенно новые задачи, поскольку обеспечивает его подсказками. Наш метод оценки использует 10-shot подход, чтобы продемонстрировать полный потенциал ИИ, при этом гарантируя, что примеры существенно отличаются от тестовых задач, так что прямое копирование невозможно. Примеры иллюстрируют форматирование и процесс решения, но не раскрывают конкретные тестовые концепции. Мы структурируем промпт так: 1. Инструкции для решения математических задач 2. 10 примеров задач и решений из различных областей 3. Тестовая задача Это позволяет модели видеть разнообразные подходы к решению, сохраняя при этом новизну и сложность тестовой задачи. • Self-reported

78.6%

Winogrande

Пятиэкземплярная задача (5-shot) - это тип предоставления примера для языковой модели, при котором вы даете пять примеров требуемой задачи, прежде чем попросить модель выполнить её самостоятельно. Это расширение методологии "few-shot" (малоэкземплярного обучения), где количество примеров специфично - ровно пять. Демонстрация пяти примеров помогает модели лучше понять шаблон или формат ожидаемого вывода, особенно для сложных или нестандартных задач. Подход 5-shot даёт модели больше контекста по сравнению с 0-shot (без примеров) или 1-shot (один пример) стратегиями, что обычно приводит к более качественным и согласованным результатам. Когда следует использовать 5-shot подход: • Для задач, требующих определенного формата или структуры • Когда необходимо продемонстрировать особенности рассуждения • Для задач, где требуется соблюдение определенного стиля или тона • Когда нужно показать конкретную методологию решения проблемы 5-shot подход является золотой серединой между предоставлением слишком малого количества примеров (что может привести к неточностям) и слишком большого количества (что может перегрузить контекстное окно модели и отнять место у основного запроса). • Self-reported

71.7%

Рассуждения

Логические рассуждения и анализ

BIG-Bench Hard

few-shot • Self-reported

52.9%

DROP

Token F1 score. 1-shot. • Self-reported

60.8%

Другие тесты

Специализированные бенчмарки

ARC-C

25-shot • Self-reported

61.6%

ARC-E

## 0-shot Модель тестируется напрямую на тестовых примерах без дополнительных инструкций или обучающих примеров. • Self-reported

81.6%

BoolQ

0-shot (нулевой пример) В модели GPT, запрос "0-shot" означает, что модели не предоставлены примеры выполнения задачи. Модель должна полагаться исключительно на свои предварительно полученные знания и понимание инструкций для формирования ответа. Например, в контексте математических задач или задач на рассуждение, модели просто предоставляется задача без демонстрации процесса решения аналогичных задач. Это противоположно методам k-shot, где модели предоставляются примеры (k примеров) перед тем, как она попытается решить задачу самостоятельно. Тестирование производительности модели в условиях 0-shot является строгой оценкой её базовых способностей. • Self-reported

81.6%

Natural Questions

5-shot • Self-reported

20.9%

PIQA

0-shot AI: используется без дополнительных инструкций, подсказок или примеров того, как выполнить задачу. Для задач 0-shot система запускается с инструкцией вопроса. Пример (в GPQA): Q: Какое значение выражения (8^67 + 27^41) mod 35? AI: Чтобы найти значение (8^67 + 27^41) mod 35, я буду использовать модульную арифметику... Преимущества: - Самый простой для настройки - Используется только инструкция задачи - Минимум вычислительных ресурсов - Оценивает базовые способности модели Недостатки: - Не дает модели примеров для обучения формату или методу решения - Может потребоваться больше итераций в решении - Иногда приводит к неоптимальным подходам к решению • Self-reported

81.0%

Social IQa

Нулевой шот Оцените возможности модели выполнять задачи без предоставления примеров. Дополнительно, вы можете оценить, насколько модель: • Способна следовать инструкциям • Умеет определять намерения пользователя • Запрашивает дополнительную информацию при неоднозначных или нечётких запросах Например, если модель должна отвечать только на запросы о математике, а пользователь задаёт вопрос о химии, проверьте, отклонит ли модель запрос. Или если пользователь спрашивает, как решить уравнение, но не предоставляет его, проверьте, запросит ли модель уравнение. • Self-reported

50.0%

TriviaQA

5-shot • Self-reported

70.2%

Лицензия и метаданные

Лицензия

proprietary

Дата анонса

26 июня 2025 г.

Последнее обновление

19 июля 2025 г.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Gemma 3n E4B

Основные характеристики

Временная шкала

Технические характеристики

Результаты бенчмарков

Общие знания

Рассуждения

Другие тесты

Лицензия и метаданные

Похожие модели

Gemma 3n E4B Instructed LiteRT Preview

Gemini 1.5 Flash 8B

Gemma 3n E2B

MedGemma 4B IT

Gemma 3 4B

Gemma 3n E2B Instructed LiteRT (Preview)

Gemma 3n E2B Instructed

Gemma 3n E4B Instructed