
Llama 3.2 11B Vision
开源Llama 3.2 11B Vision 是中等规模的多模态模型,在图像推理任务上表现优秀,适合需要视觉能力的应用场景。
Llama 3.2 11B Vision 是 Meta 的中等规模多模态模型,平衡了性能和效率,适合部署在资源受限的环境中。
核心参数
上下文窗口
128,000
输入模态
文本
开源状态
开源
评测数据
💡 开源模型评测数据可能不完整,部分评测来自社区贡献
评测分类
MMLU
68.0%一般
↑ 越高越好
GSM8K
73.0%一般
↑ 越高越好
HumanEval
60.0%一般
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
多模态理解
支持图像输入和视觉推理
高效部署
11B 参数规模适合边缘和本地部署
128K 上下文
支持 128K token 的上下文窗口
开源可微调
支持自定义微调和部署
适用场景
开发者
构建轻量级视觉应用
中小企业
成本敏感的多模态应用
常见问题
Llama 3.2 11B Vision是什么?▼
Llama 3.2 11B Vision 是 Meta 的中等规模多模态模型,平衡了性能和效率,适合部署在资源受限的环境中。
Llama 3.2 11B Vision的核心参数是什么?▼
Llama 3.2 11B Vision是Meta推出的模型,上下文窗口128,000tokens,开源模型。
Llama 3.2 11B Vision的API价格是多少?▼
Llama 3.2 11B Vision的API调用价格约为¥0.00/Mtoken(输入)。具体价格请以官方为准。
Llama 3.2 11B Vision的评测表现如何?▼
Llama 3.2 11B Vision在多个基准测试中表现优秀:undefined: 73,undefined: 60,undefined: 68等。
Llama 3.2 11B Vision有哪些主要功能?▼
多模态理解、高效部署、128K 上下文、开源可微调
发布日期:2024/9/25最后更新:2026/5/6数据来源:即客AI模型库