通义听悟是音视频内容AI助手,依托通义千问语言模型、音视频AI模型能力,帮助用户记录、整理和分析音视频内容。
核心参数
输入模态
文本
开源状态
闭源
规格信息
声音克隆
不支持
流式输出
不支持
API 定价
国内定价(单位:元/分钟)
Standard
¥0.05/分钟
功能特性
音视频转录
高精度识别
智能总结
内容提炼
待办提取
自动生成
跨语言问答
多语言支持
适用场景
企业
会议记录
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| 通义听悟 | 通义听悟 | - | - | - |
| Qwen ASR | Qwen3 ASR Flash | - | - | - |
常见问题
通义听悟是什么?▼
通义听悟是音视频内容AI助手,依托通义千问语言模型、音视频AI模型能力,帮助用户记录、整理和分析音视频内容。
通义听悟的核心参数是什么?▼
通义听悟是阿里巴巴推出的模型,闭源模型。
通义听悟有哪些主要功能?▼
音视频转录、智能总结、待办提取、跨语言问答
最后更新:2026/5/6数据来源:即客AI模型库
