导航菜单
切换主题
Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview

Google 低延迟音频到音频模型,针对实时对话优化

Gemini 3.1 Flash Live Preview 是低延迟的音频到音频模型,专门针对实时对话场景优化,支持声学细节检测、数字精度和多模态感知。

核心参数

上下文窗口
1,048,576
最大输出
65,536
输入模态
文本
开源状态
闭源

规格信息

架构类型
Dense 架构

API 定价

国际定价(单位:$/Mtoken)

文本输入Mtoken
输入
$0.75
输出
-
音频输入Mtoken
输入
$3
输出
-
文本输出Mtoken
输入
-
输出
$4.5
音频输出Mtoken
输入
-
输出
$12

功能特性

低延迟音频交互

实时音频到音频处理,延迟低于 500ms

实时对话优化

专为流畅的语音对话场景设计

声学细节检测

精确识别语音中的情感、语气和声学特征

多模态感知

同时处理音频、文本和视觉输入

适用场景

语音应用开发者

构建实时语音助手和对话系统

AI 客服团队

部署智能语音客服和呼叫中心解决方案

无障碍应用开发者

为视障人士开发语音交互应用

同厂商系列对比

系列代表模型上下文输入价格输出价格
Gemini 3.1Gemini 3.1 Flash Live Preview1,048,576$0.75/Mtoken-
Gemini 2.5Gemini 2.5 Flash Native Audio1,048,576$0.1/Mtoken$0.4/Mtoken

常见问题

Gemini 3.1 Flash Live Preview是什么?
Gemini 3.1 Flash Live Preview 是低延迟的音频到音频模型,专门针对实时对话场景优化,支持声学细节检测、数字精度和多模态感知。
Gemini 3.1 Flash Live Preview的核心参数是什么?
Gemini 3.1 Flash Live Preview是Google推出的模型,上下文窗口1,048,576tokens,最大输出65,536tokens,闭源模型。
Gemini 3.1 Flash Live Preview的API价格是多少?
Gemini 3.1 Flash Live Preview的API调用价格约为$750.00/Mtoken(输入)。具体价格请以官方为准。
Gemini 3.1 Flash Live Preview的评测表现如何?
Gemini 3.1 Flash Live Preview在多个基准测试中表现优秀:undefined: 4.2等。
Gemini 3.1 Flash Live Preview有哪些主要功能?
低延迟音频交互、实时对话优化、声学细节检测、多模态感知
最后更新:2026/5/6数据来源:即客AI模型库官网验证 ↗API文档 ↗