导航菜单
切换主题
GPT Realtime 1.5

GPT Realtime 1.5

OpenAI 实时多模态模型,支持低延迟音频交互

GPT Realtime 1.5 是 OpenAI 的实时多模态模型,支持低延迟的音频到音频交互,适合语音助手、实时对话等场景。

核心参数

输入模态
文本
开源状态
闭源

API 定价

国际定价(单位:$/Mtoken)

音频输入Mtoken
输入
$32
输出
$64
缓存价格
缓存读取
$0.4
缓存写入
-
文本输入Mtoken
输入
$4
输出
$16
缓存价格
缓存读取
$0.4
缓存写入
-

功能特性

实时交互

低延迟音频到音频交互

多模态输入

支持音频和文本输入

语音生成

自然语音输出能力

实时对话

适合实时对话场景

适用场景

语音应用开发者

构建语音助手和对话应用

AI 助手开发者

实时交互 AI 助手

常见问题

GPT Realtime 1.5是什么?
GPT Realtime 1.5 是 OpenAI 的实时多模态模型,支持低延迟的音频到音频交互,适合语音助手、实时对话等场景。
GPT Realtime 1.5的核心参数是什么?
GPT Realtime 1.5是OpenAI推出的模型,闭源模型。
GPT Realtime 1.5的API价格是多少?
GPT Realtime 1.5的API调用价格约为$32000.00/Mtoken(输入)。具体价格请以官方为准。
GPT Realtime 1.5的评测表现如何?
GPT Realtime 1.5在多个基准测试中表现优秀:undefined: 4.4等。
GPT Realtime 1.5有哪些主要功能?
实时交互、多模态输入、语音生成、实时对话
最后更新:2026/5/6数据来源:即客AI模型库