IBM Granite 4.0 Tiny Preview
Предварительная версия самой маленькой модели из готовящегося семейства Granite 4.0, выпущенная в мае 2025 года. Она использует новую гибридную архитектуру Mamba-2/Transformer с детализированной смесью экспертов (MoE) — всего 7 миллиардов параметров, из которых 1 миллиард активен при инференсе. Эта превью-версия частично обучена на 2,5 триллионах токенов, но демонстрирует значительную эффективность памяти и потенциал производительности, проверенный для контекстного окна длиной не менее 128K без позиционного кодирования.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Общие знания
Программирование
Математика
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиGranite 3.3 8B Instruct
IBM
Granite 3.3 8B Base
IBM
Qwen2.5-Coder 7B Instruct
Alibaba
Gemma 3 1B
DeepSeek R1 Distill Qwen 1.5B
DeepSeek
DeepSeek R1 Distill Qwen 7B
DeepSeek
DeepSeek R1 Distill Llama 8B
DeepSeek
Llama 3.1 8B Instruct
Meta
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.