盘古多模态大模型是华为的世界模型,支持文本、图像、视频、音频等多模态的理解与生成。
使用方法
1
通过华为云 API 调用
2
选择盘古多模态模型
3
发送多模态请求
核心参数
输入模态
text+image+video+audio
开源状态
闭源
API 定价
国内定价(单位:元/Mtoken)
标准每百万tokens
输入
-
输出
-
标准每百万tokens
输入
-
输出
-
功能特性
世界模型
多模态理解生成
跨模态推理
适用场景
研究人员
企业用户
常见问题
Pangu Multimodal是什么?▼
盘古多模态大模型是华为的世界模型,支持文本、图像、视频、音频等多模态的理解与生成。
Pangu Multimodal的核心参数是什么?▼
Pangu Multimodal是华为推出的模型,闭源模型。
Pangu Multimodal有哪些主要功能?▼
世界模型、多模态理解生成、跨模态推理
