← 返回 AI音频

是什么
Whisper是OpenAI推出的自动语音识别(ASR)系统,使用从网络收集的680,000小时多语言数据训练。支持99种语言的语音转文字,准确率高,完全开源免费。
主要功能
199种语言
2高准确率
3多语言支持
4噪声鲁棒
5开源免费
6API接口
7本地部署
8多模型大小
如何使用
1
获取模型
从OpenAI获取Whisper模型
2
安装部署
安装依赖或使用API
3
上传音频
提供要转录的音频文件
4
获取文本
模型返回转录文本
价格方案
开源版免费
- ✓ 完整功能
- ✓ 本地部署
- ✓ 无限制
API$0.006/分钟
- ✓ OpenAI API
- ✓ 高可用
- ✓ 简单集成
适用人群
👥开发者
👥AI研究者
👥语音应用开发者
👥内容创作者
👥开源爱好者
常见问题
Whisper是什么?▼
Whisper是OpenAI推出的自动语音识别(ASR)系统,使用从网络收集的680,000小时多语言数据训练。支持99种语言的语音转文字,准确率高,完全开源免费。
Whisper有哪些主要功能?▼
99种语言、高准确率、多语言支持、噪声鲁棒、开源免费
Whisper收费吗?▼
Whisper采用部分免费(提供免费版和付费版)模式。提供免费版本可用。






