
Llama 3.2 90B Vision
开源Llama 3.2 90B Vision 是 Meta 最大的多模态模型,支持图像推理任务,如文档理解、图像描述和视觉定位。
Llama 3.2 90B Vision 是 Meta 的旗舰级多模态大语言模型,能够处理文本和图像输入,在视觉推理任务上表现出色。
核心参数
上下文窗口
128,000
输入模态
文本
开源状态
开源
评测数据
💡 开源模型评测数据可能不完整,部分评测来自社区贡献
评测分类
MMLU
80.0%良好
↑ 越高越好
GSM8K
85.0%良好
↑ 越高越好
HumanEval
75.0%良好
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
多模态理解
支持图像输入,可进行文档级理解、图像描述和视觉定位
图表分析
能够理解图表、图形等视觉数据并回答相关问题
128K 上下文
支持 128K token 的超长上下文窗口
开源可微调
支持使用 torchtune 进行微调
适用场景
开发者
构建视觉问答和文档分析应用
企业
自动化文档处理和数据提取
研究人员
多模态模型研究
常见问题
Llama 3.2 90B Vision是什么?▼
Llama 3.2 90B Vision 是 Meta 的旗舰级多模态大语言模型,能够处理文本和图像输入,在视觉推理任务上表现出色。
Llama 3.2 90B Vision的核心参数是什么?▼
Llama 3.2 90B Vision是Meta推出的模型,上下文窗口128,000tokens,开源模型。
Llama 3.2 90B Vision的API价格是多少?▼
Llama 3.2 90B Vision的API调用价格约为¥0.00/Mtoken(输入)。具体价格请以官方为准。
Llama 3.2 90B Vision的评测表现如何?▼
Llama 3.2 90B Vision在多个基准测试中表现优秀:undefined: 85,undefined: 75,undefined: 80等。
Llama 3.2 90B Vision有哪些主要功能?▼
多模态理解、图表分析、128K 上下文、开源可微调
发布日期:2024/9/25最后更新:2026/5/6数据来源:即客AI模型库