Phi-4-multimodal-instruct
МультимодальнаяPhi-4-multimodal-instruct — это легковесная (5,57 млрд параметров) открытая мультимодальная базовая модель, которая использует исследования и датасеты из Phi-3.5 и 4.0. Она обрабатывает текстовые, изображения и аудиовходы для генерации текстовых выходов, поддерживая контекстное окно длиной 128K токенов. Усовершенствована с помощью SFT, DPO и RLHF для следования инструкциям и безопасности.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиPhi-3.5-mini-instruct
Microsoft
Gemini 1.5 Flash 8B
Gemma 3 4B
Gemma 3n E4B Instructed
Phi 4
Microsoft
Pixtral Large
Mistral AI
Llama 3.2 90B Instruct
Meta
Gemma 3 27B
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.