导航菜单
切换主题
Pangu Multimodal

Pangu Multimodal

华为盘古多模态大模型

盘古多模态大模型是华为的世界模型,支持文本、图像、视频、音频等多模态的理解与生成。

使用方法

1

通过华为云 API 调用

2

选择盘古多模态模型

3

发送多模态请求

核心参数

输入模态
text+image+video+audio
开源状态
闭源

API 定价

国内定价(单位:元/Mtoken)

标准每百万tokens
输入
-
输出
-
标准每百万tokens
输入
-
输出
-

功能特性

世界模型

多模态理解生成

跨模态推理

适用场景

研究人员
企业用户

常见问题

Pangu Multimodal是什么?
盘古多模态大模型是华为的世界模型,支持文本、图像、视频、音频等多模态的理解与生成。
Pangu Multimodal的核心参数是什么?
Pangu Multimodal是华为推出的模型,闭源模型。
Pangu Multimodal有哪些主要功能?
世界模型、多模态理解生成、跨模态推理
最后更新:2026/5/15数据来源:即客AI模型库官网验证 ↗