导航菜单
切换主题
通义听悟

通义听悟

通义听悟音视频理解服务

通义听悟是音视频内容AI助手,依托通义千问语言模型、音视频AI模型能力,帮助用户记录、整理和分析音视频内容。

核心参数

输入模态
文本
开源状态
闭源

规格信息

声音克隆
不支持
流式输出
不支持

API 定价

国内定价(单位:元/分钟)

Standard
¥0.05/分钟

功能特性

音视频转录

高精度识别

智能总结

内容提炼

待办提取

自动生成

跨语言问答

多语言支持

适用场景

企业

会议记录

同厂商系列对比

系列代表模型上下文输入价格输出价格
通义听悟通义听悟---
Qwen ASRQwen3 ASR Flash---

常见问题

通义听悟是什么?
通义听悟是音视频内容AI助手,依托通义千问语言模型、音视频AI模型能力,帮助用户记录、整理和分析音视频内容。
通义听悟的核心参数是什么?
通义听悟是阿里巴巴推出的模型,闭源模型。
通义听悟有哪些主要功能?
音视频转录、智能总结、待办提取、跨语言问答
最后更新:2026/5/6数据来源:即客AI模型库