Phi-4-multimodal-instruct
МультимодальнаяPhi-4-multimodal-instruct — это легковесная (5,57 млрд параметров) открытая мультимодальная базовая модель, которая использует исследования и датасеты из Phi-3.5 и 4.0. Она обрабатывает текстовые, изображения и аудиовходы для генерации текстовых выходов, поддерживая контекстное окно длиной 128K токенов. Усовершенствована с помощью SFT, DPO и RLHF для следования инструкциям и безопасности.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиPhi-3.5-vision-instruct
Microsoft
Phi-3.5-mini-instruct
Microsoft
Phi 4 Mini Reasoning
Microsoft
Phi 4 Mini
Microsoft
Granite 3.3 8B Instruct
IBM
Gemma 3n E4B
Granite 3.3 8B Base
IBM
DeepSeek VL2 Tiny
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.