导航菜单
切换主题
Llama 3.2 11B Vision

Llama 3.2 11B Vision

开源
Meta·Llama 3.2 Vision·2024-09发布

Llama 3.2 11B Vision 是中等规模的多模态模型,在图像推理任务上表现优秀,适合需要视觉能力的应用场景。

Llama 3.2 11B Vision 是 Meta 的中等规模多模态模型,平衡了性能和效率,适合部署在资源受限的环境中。

核心参数

上下文窗口
128,000
输入模态
文本
开源状态
开源

评测数据

💡 开源模型评测数据可能不完整,部分评测来自社区贡献

评测分类

MMLU

68.0%一般

GSM8K

73.0%一般

HumanEval

60.0%一般
优秀
良好
一般
较差
很低

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

多模态理解

支持图像输入和视觉推理

高效部署

11B 参数规模适合边缘和本地部署

128K 上下文

支持 128K token 的上下文窗口

开源可微调

支持自定义微调和部署

适用场景

开发者

构建轻量级视觉应用

中小企业

成本敏感的多模态应用

常见问题

Llama 3.2 11B Vision是什么?
Llama 3.2 11B Vision 是 Meta 的中等规模多模态模型,平衡了性能和效率,适合部署在资源受限的环境中。
Llama 3.2 11B Vision的核心参数是什么?
Llama 3.2 11B Vision是Meta推出的模型,上下文窗口128,000tokens,开源模型。
Llama 3.2 11B Vision的API价格是多少?
Llama 3.2 11B Vision的API调用价格约为¥0.00/Mtoken(输入)。具体价格请以官方为准。
Llama 3.2 11B Vision的评测表现如何?
Llama 3.2 11B Vision在多个基准测试中表现优秀:undefined: 73,undefined: 60,undefined: 68等。
Llama 3.2 11B Vision有哪些主要功能?
多模态理解、高效部署、128K 上下文、开源可微调
发布日期:2024/9/25最后更新:2026/5/6数据来源:即客AI模型库