
GPT Realtime 1.5 是 OpenAI 的实时多模态模型,支持低延迟的音频到音频交互,适合语音助手、实时对话等场景。
核心参数
输入模态
文本
开源状态
闭源
API 定价
国际定价(单位:$/Mtoken)
音频输入Mtoken
输入
$32
输出
$64
缓存价格
缓存读取
$0.4
缓存写入
-
文本输入Mtoken
输入
$4
输出
$16
缓存价格
缓存读取
$0.4
缓存写入
-
功能特性
实时交互
低延迟音频到音频交互
多模态输入
支持音频和文本输入
语音生成
自然语音输出能力
实时对话
适合实时对话场景
适用场景
语音应用开发者
构建语音助手和对话应用
AI 助手开发者
实时交互 AI 助手
常见问题
GPT Realtime 1.5是什么?▼
GPT Realtime 1.5 是 OpenAI 的实时多模态模型,支持低延迟的音频到音频交互,适合语音助手、实时对话等场景。
GPT Realtime 1.5的核心参数是什么?▼
GPT Realtime 1.5是OpenAI推出的模型,闭源模型。
GPT Realtime 1.5的API价格是多少?▼
GPT Realtime 1.5的API调用价格约为$32000.00/Mtoken(输入)。具体价格请以官方为准。
GPT Realtime 1.5的评测表现如何?▼
GPT Realtime 1.5在多个基准测试中表现优秀:undefined: 4.4等。
GPT Realtime 1.5有哪些主要功能?▼
实时交互、多模态输入、语音生成、实时对话
最后更新:2026/5/6数据来源:即客AI模型库