Nemotron-VLM 是NVIDIA的视觉语言模型,支持图像理解和多模态推理。
使用方法
1
从NVIDIA NIM下载
2
或通过API调用
3
发送多模态请求
核心参数
上下文窗口
8,192
最大输出
4,096
输入模态
text+image
开源状态
开源
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
视觉语言
图像理解
多模态推理
适用场景
开发者
视觉应用
常见问题
Nemotron-VLM是什么?▼
Nemotron-VLM 是NVIDIA的视觉语言模型,支持图像理解和多模态推理。
Nemotron-VLM的核心参数是什么?▼
Nemotron-VLM是NVIDIA推出的模型,上下文窗口8,192tokens,最大输出4,096tokens,开源模型。
Nemotron-VLM的API价格是多少?▼
Nemotron-VLM是开源模型,可以免费下载使用。如需API服务,可使用各大推理平台提供的托管服务。
Nemotron-VLM有哪些主要功能?▼
视觉语言、图像理解、多模态推理
