导航菜单

切换主题

Qwen-Audio

Qwen-Audio

开源

阿里巴巴·通义千问 Audio

通义千问音频理解模型

Qwen-Audio 是通义千问的音频理解模型，支持语音识别、情感分析、音频事件检测等多种音频理解任务。

核心参数

输入模态

文本

开源状态

开源

API 定价

🌱 开源模型

该模型为开源模型，可免费使用或自行部署

功能特性

语音识别

高精度转写

情感分析

情绪理解

事件检测

声音识别

适用场景

开发者

音频分析

同厂商系列对比

系列	代表模型	上下文	输入价格	输出价格
通义千问 Audio	Qwen-Audio	-	-	-
通义千问 VL	Qwen2.5 VL	32,768	¥0.8/Mtoken	¥2/Mtoken

常见问题

Qwen-Audio是什么？▼

Qwen-Audio 是通义千问的音频理解模型，支持语音识别、情感分析、音频事件检测等多种音频理解任务。

Qwen-Audio的核心参数是什么？▼

Qwen-Audio是阿里巴巴推出的模型，开源模型。

Qwen-Audio有哪些主要功能？▼

语音识别、情感分析、事件检测

最后更新：2026/5/6数据来源：即客AI模型库