Pangu Multimodal

Name: Pangu Multimodal
Author: 华为

华为盘古多模态大模型

盘古多模态大模型是华为的世界模型，支持文本、图像、视频、音频等多模态的理解与生成。

使用方法

通过华为云 API 调用

选择盘古多模态模型

发送多模态请求

输入模态

text+image+video+audio

开源状态

闭源

国内定价（单位：元/Mtoken）

标准每百万tokens

输入

输出

标准每百万tokens

输入

输出

研究人员

企业用户

Pangu Multimodal是什么？▼

盘古多模态大模型是华为的世界模型，支持文本、图像、视频、音频等多模态的理解与生成。

Pangu Multimodal的核心参数是什么？▼

Pangu Multimodal是华为推出的模型，闭源模型。

Pangu Multimodal有哪些主要功能？▼

世界模型、多模态理解生成、跨模态推理

最后更新：2026/5/15数据来源：即客AI模型库官网验证 ↗