
GPT-4o Transcribe 是 OpenAI 的高质量语音转录模型,能够将音频转换为文本,支持多语言识别。
核心参数
输入模态
文本
开源状态
闭源
评测数据
评测分类
Aider Polyglot
72.9%一般
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
国际定价(单位:$/Mtoken)
标准Mtoken
输入
$2.5
输出
$10
功能特性
高质量转录
准确的语音转文本
多语言
支持多种语言识别
噪声处理
优秀的噪声处理能力
时间戳
支持时间戳输出
适用场景
应用开发者
语音转文本应用
内容创作者
音频内容转录
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| GPT Transcribe | GPT-4o Transcribe | - | $2.5/Mtoken | $10/Mtoken |
| GPT-5 | GPT-5.5 | 400,000 | $5/Mtoken | $30/Mtoken |
| GPT-5 Mini | GPT-5.4 Mini | 200,000 | $0.75/Mtoken | $4.5/Mtoken |
| GPT-5 Pro | GPT-5.5 Pro | 400,000 | $30/Mtoken | $180/Mtoken |
常见问题
GPT-4o Transcribe是什么?▼
GPT-4o Transcribe 是 OpenAI 的高质量语音转录模型,能够将音频转换为文本,支持多语言识别。
GPT-4o Transcribe的核心参数是什么?▼
GPT-4o Transcribe是OpenAI推出的模型,闭源模型。
GPT-4o Transcribe的API价格是多少?▼
GPT-4o Transcribe的API调用价格约为$2500.00/Mtoken(输入)。具体价格请以官方为准。
GPT-4o Transcribe的评测表现如何?▼
GPT-4o Transcribe在多个基准测试中表现优秀:undefined: 72.9等。
GPT-4o Transcribe有哪些主要功能?▼
高质量转录、多语言、噪声处理、时间戳
最后更新:2026/5/6数据来源:即客AI模型库