LongCat-Flash-Lite
LongCat-Flash-Lite — лёгкая MoE-модель от Meituan с 68.5B параметров и активацией всего 2.9B–4.5B на токен. Исследует расширение N-gram эмбеддингов как новое направление масштабирования, поддерживает контекст 256K через YaRN. Оптимизирована для агентных инструментов и программирования, достигая скорости инференса 500–700 токенов в секунду.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Общие знания
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиLongCat-Flash-Thinking
Meituan
Llama 3.3 70B Instruct
Meta
Phi 4 Reasoning Plus
Microsoft
Phi 4 Reasoning
Microsoft
Llama 3.1 70B Instruct
Meta
Hermes 3 70B
Nous Research
Qwen2.5 14B Instruct
Alibaba
Nemotron 3 Nano (30B A3B)
NVIDIA
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.