导航菜单
切换主题
Qwen-Audio

Qwen-Audio

开源

通义千问音频理解模型

Qwen-Audio 是通义千问的音频理解模型,支持语音识别、情感分析、音频事件检测等多种音频理解任务。

核心参数

输入模态
文本
开源状态
开源

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

语音识别

高精度转写

情感分析

情绪理解

事件检测

声音识别

适用场景

开发者

音频分析

同厂商系列对比

系列代表模型上下文输入价格输出价格
通义千问 AudioQwen-Audio---
通义千问 VLQwen2.5 VL32,768¥0.8/Mtoken¥2/Mtoken

常见问题

Qwen-Audio是什么?
Qwen-Audio 是通义千问的音频理解模型,支持语音识别、情感分析、音频事件检测等多种音频理解任务。
Qwen-Audio的核心参数是什么?
Qwen-Audio是阿里巴巴推出的模型,开源模型。
Qwen-Audio有哪些主要功能?
语音识别、情感分析、事件检测
最后更新:2026/5/6数据来源:即客AI模型库