
Gemini 3.1 Flash Live Preview 是低延迟的音频到音频模型,专门针对实时对话场景优化,支持声学细节检测、数字精度和多模态感知。
核心参数
上下文窗口
1,048,576
最大输出
65,536
输入模态
文本
开源状态
闭源
规格信息
架构类型
Dense 架构
API 定价
国际定价(单位:$/Mtoken)
文本输入Mtoken
输入
$0.75
输出
-
音频输入Mtoken
输入
$3
输出
-
文本输出Mtoken
输入
-
输出
$4.5
音频输出Mtoken
输入
-
输出
$12
功能特性
低延迟音频交互
实时音频到音频处理,延迟低于 500ms
实时对话优化
专为流畅的语音对话场景设计
声学细节检测
精确识别语音中的情感、语气和声学特征
多模态感知
同时处理音频、文本和视觉输入
适用场景
语音应用开发者
构建实时语音助手和对话系统
AI 客服团队
部署智能语音客服和呼叫中心解决方案
无障碍应用开发者
为视障人士开发语音交互应用
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| Gemini 3.1 | Gemini 3.1 Flash Live Preview | 1,048,576 | $0.75/Mtoken | - |
| Gemini 2.5 | Gemini 2.5 Flash Native Audio | 1,048,576 | $0.1/Mtoken | $0.4/Mtoken |
常见问题
Gemini 3.1 Flash Live Preview是什么?▼
Gemini 3.1 Flash Live Preview 是低延迟的音频到音频模型,专门针对实时对话场景优化,支持声学细节检测、数字精度和多模态感知。
Gemini 3.1 Flash Live Preview的核心参数是什么?▼
Gemini 3.1 Flash Live Preview是Google推出的模型,上下文窗口1,048,576tokens,最大输出65,536tokens,闭源模型。
Gemini 3.1 Flash Live Preview的API价格是多少?▼
Gemini 3.1 Flash Live Preview的API调用价格约为$750.00/Mtoken(输入)。具体价格请以官方为准。
Gemini 3.1 Flash Live Preview的评测表现如何?▼
Gemini 3.1 Flash Live Preview在多个基准测试中表现优秀:undefined: 4.2等。
Gemini 3.1 Flash Live Preview有哪些主要功能?▼
低延迟音频交互、实时对话优化、声学细节检测、多模态感知