◈
InternVL 2.0书生·万象是上海AI实验室的多模态大模型,支持图像、视频、文字、语音、3D点云等模态处理,采用渐进式对齐训练策略,仅需20%算力即可达到同等效果。
使用方法
1
2
3
核心参数
上下文窗口
8,192
最大输出
4,096
输入模态
text+image+video+audio
开源状态
开源
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
全模态
图像、视频、文字、语音、3D
高效训练
20%算力达到同等效果
开源领先
多项指标比肩GPT-4V
常见问题
InternVL-2.0是什么?▼
InternVL 2.0书生·万象是上海AI实验室的多模态大模型,支持图像、视频、文字、语音、3D点云等模态处理,采用渐进式对齐训练策略,仅需20%算力即可达到同等效果。
InternVL-2.0的核心参数是什么?▼
InternVL-2.0是上海人工智能实验室推出的模型,上下文窗口8,192tokens,最大输出4,096tokens,开源模型。
InternVL-2.0有哪些主要功能?▼
全模态、高效训练、开源领先
最后更新:2026/5/15数据来源:即客AI模型库