
Gemini 3.1 Flash TTS Preview 是针对价格性能和低延迟优化的文本转语音模型,支持可控的语音生成。音频令牌对应每秒 25 个令牌。
核心参数
上下文窗口
8,192
最大输出
4,096
输入模态
文本
开源状态
闭源
规格信息
音频类型
语音合成
声音克隆
不支持
流式输出
不支持
API 定价
国际定价(单位:$/分钟)
输入
输入
$1/分钟
输出
-/分钟
输出
输入
-/分钟
输出
$20/分钟
功能特性
性价比优化
在保持高质量的同时提供极具竞争力的价格
低延迟
实时语音合成,适合交互式应用
可控语音生成
支持多种声音风格、语速和情感调节
多语言支持
支持 100+ 语言的高质量语音合成
适用场景
有声书制作者
批量制作有声读物和播客内容
教育平台
创建多语言课程讲解和配音
应用开发者
为应用添加语音播报和导航功能
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| Gemini 3.1 | Gemini 3.1 Flash TTS Preview | 8,192 | $1/分钟 | - |
| Gemini 2.5 | Gemini 2.5 Flash Native Audio | 1,048,576 | $0.1/Mtoken | $0.4/Mtoken |
常见问题
Gemini 3.1 Flash TTS Preview是什么?▼
Gemini 3.1 Flash TTS Preview 是针对价格性能和低延迟优化的文本转语音模型,支持可控的语音生成。音频令牌对应每秒 25 个令牌。
Gemini 3.1 Flash TTS Preview的核心参数是什么?▼
Gemini 3.1 Flash TTS Preview是Google推出的模型,上下文窗口8,192tokens,最大输出4,096tokens,闭源模型。
Gemini 3.1 Flash TTS Preview的API价格是多少?▼
Gemini 3.1 Flash TTS Preview的API调用价格约为$1000.00/Mtoken(输入)。具体价格请以官方为准。
Gemini 3.1 Flash TTS Preview的评测表现如何?▼
Gemini 3.1 Flash TTS Preview在多个基准测试中表现优秀:undefined: 4.35,undefined: 4.2等。
Gemini 3.1 Flash TTS Preview有哪些主要功能?▼
性价比优化、低延迟、可控语音生成、多语言支持