
Qwen-Audio 是通义千问的音频理解模型,支持语音识别、情感分析、音频事件检测等多种音频理解任务。
核心参数
输入模态
文本
开源状态
开源
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
语音识别
高精度转写
情感分析
情绪理解
事件检测
声音识别
适用场景
开发者
音频分析
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| 通义千问 Audio | Qwen-Audio | - | - | - |
| 通义千问 VL | Qwen2.5 VL | 32,768 | ¥0.8/Mtoken | ¥2/Mtoken |
常见问题
Qwen-Audio是什么?▼
Qwen-Audio 是通义千问的音频理解模型,支持语音识别、情感分析、音频事件检测等多种音频理解任务。
Qwen-Audio的核心参数是什么?▼
Qwen-Audio是阿里巴巴推出的模型,开源模型。
Qwen-Audio有哪些主要功能?▼
语音识别、情感分析、事件检测
最后更新:2026/5/6数据来源:即客AI模型库