导航菜单
切换主题
Llama 3.2 90B Vision

Llama 3.2 90B Vision

开源
Meta·Llama 3.2 Vision·2024-09发布

Llama 3.2 90B Vision 是 Meta 最大的多模态模型,支持图像推理任务,如文档理解、图像描述和视觉定位。

Llama 3.2 90B Vision 是 Meta 的旗舰级多模态大语言模型,能够处理文本和图像输入,在视觉推理任务上表现出色。

核心参数

上下文窗口
128,000
输入模态
文本
开源状态
开源

评测数据

💡 开源模型评测数据可能不完整,部分评测来自社区贡献

评测分类

MMLU

80.0%良好

GSM8K

85.0%良好

HumanEval

75.0%良好
优秀
良好
一般
较差
很低

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

多模态理解

支持图像输入,可进行文档级理解、图像描述和视觉定位

图表分析

能够理解图表、图形等视觉数据并回答相关问题

128K 上下文

支持 128K token 的超长上下文窗口

开源可微调

支持使用 torchtune 进行微调

适用场景

开发者

构建视觉问答和文档分析应用

企业

自动化文档处理和数据提取

研究人员

多模态模型研究

常见问题

Llama 3.2 90B Vision是什么?
Llama 3.2 90B Vision 是 Meta 的旗舰级多模态大语言模型,能够处理文本和图像输入,在视觉推理任务上表现出色。
Llama 3.2 90B Vision的核心参数是什么?
Llama 3.2 90B Vision是Meta推出的模型,上下文窗口128,000tokens,开源模型。
Llama 3.2 90B Vision的API价格是多少?
Llama 3.2 90B Vision的API调用价格约为¥0.00/Mtoken(输入)。具体价格请以官方为准。
Llama 3.2 90B Vision的评测表现如何?
Llama 3.2 90B Vision在多个基准测试中表现优秀:undefined: 85,undefined: 75,undefined: 80等。
Llama 3.2 90B Vision有哪些主要功能?
多模态理解、图表分析、128K 上下文、开源可微调
发布日期:2024/9/25最后更新:2026/5/6数据来源:即客AI模型库