导航菜单

切换主题

通义听悟

通义听悟

阿里巴巴·通义听悟

通义听悟音视频理解服务

通义听悟是音视频内容AI助手，依托通义千问语言模型、音视频AI模型能力，帮助用户记录、整理和分析音视频内容。

核心参数

输入模态

文本

开源状态

闭源

规格信息

声音克隆

不支持

流式输出

不支持

API 定价

国内定价（单位：元/分钟）

Standard

¥0.05/分钟

功能特性

音视频转录

高精度识别

智能总结

内容提炼

待办提取

自动生成

跨语言问答

多语言支持

适用场景

企业

会议记录

同厂商系列对比

系列	代表模型	上下文	输入价格	输出价格
通义听悟	通义听悟	-	-	-
Qwen ASR	Qwen3 ASR Flash	-	-	-

常见问题

通义听悟是什么？▼

通义听悟是音视频内容AI助手，依托通义千问语言模型、音视频AI模型能力，帮助用户记录、整理和分析音视频内容。

通义听悟的核心参数是什么？▼

通义听悟是阿里巴巴推出的模型，闭源模型。

通义听悟有哪些主要功能？▼

音视频转录、智能总结、待办提取、跨语言问答

最后更新：2026/5/6数据来源：即客AI模型库