导航菜单
切换主题

InternVL-2.0

开源

书生·万象多模态大模型,支持图像、视频、文字、语音、3D点云

别名:书生·万象

InternVL 2.0书生·万象是上海AI实验室的多模态大模型,支持图像、视频、文字、语音、3D点云等模态处理,采用渐进式对齐训练策略,仅需20%算力即可达到同等效果。

使用方法

1
2
3

核心参数

上下文窗口
8,192
最大输出
4,096
输入模态
text+image+video+audio
开源状态
开源

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

全模态

图像、视频、文字、语音、3D

高效训练

20%算力达到同等效果

开源领先

多项指标比肩GPT-4V

常见问题

InternVL-2.0是什么?
InternVL 2.0书生·万象是上海AI实验室的多模态大模型,支持图像、视频、文字、语音、3D点云等模态处理,采用渐进式对齐训练策略,仅需20%算力即可达到同等效果。
InternVL-2.0的核心参数是什么?
InternVL-2.0是上海人工智能实验室推出的模型,上下文窗口8,192tokens,最大输出4,096tokens,开源模型。
InternVL-2.0有哪些主要功能?
全模态、高效训练、开源领先
最后更新:2026/5/15数据来源:即客AI模型库