
Gemini 2.5 Flash 是一款轻量级多模态模型,在保持高质量输出的同时提供更低的延迟和成本。它同样支持 100 万 token 上下文,非常适合需要快速响应的生产环境应用。
核心参数
上下文窗口
1,048,576
最大输出
65,536
输入模态
文本
开源状态
闭源
规格信息
架构类型
Dense 架构
评测数据
评测分类
MMLU
88.0%良好
↑ 越高越好
GSM8K
94.0%优秀
↑ 越高越好
MATH
80.0%良好
↑ 越高越好
GPQA
75.0%良好
↑ 越高越好
HumanEval
87.0%良好
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
国际定价(单位:$/Mtoken)
标准Mtoken
输入
$0.075
输出
$0.3
功能特性
高性能低成本
在保持高质量的同时提供极具竞争力的价格
低延迟高吞吐
优化的推理速度,适合大规模并发
100万 token 上下文
支持长文档和复杂上下文处理
多模态支持
支持文本、图像、音频、视频输入
适用场景
初创企业
需要性价比高的 AI 解决方案
高并发应用
聊天机器人、实时翻译、内容生成
开发者
快速原型开发和生产部署
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| Gemini 2.5 | Gemini 2.5 Flash | 1,048,576 | $0.075/Mtoken | $0.3/Mtoken |
| Gemini 3.1 | Gemini 3.1 Pro Preview | 1,048,576 | $2/Mtoken | $12/Mtoken |
| Gemini 3 | Gemini 3 Flash Preview | 1,048,576 | $0.5/Mtoken | $3/Mtoken |
| Gemini 2.0 | Gemini 2.0 Flash | 1,048,576 | $0.1/Mtoken | $0.4/Mtoken |
常见问题
Gemini 2.5 Flash是什么?▼
Gemini 2.5 Flash 是一款轻量级多模态模型,在保持高质量输出的同时提供更低的延迟和成本。它同样支持 100 万 token 上下文,非常适合需要快速响应的生产环境应用。
Gemini 2.5 Flash的核心参数是什么?▼
Gemini 2.5 Flash是Google推出的模型,上下文窗口1,048,576tokens,最大输出65,536tokens,闭源模型。
Gemini 2.5 Flash的API价格是多少?▼
Gemini 2.5 Flash的API调用价格约为$75.00/Mtoken(输入)。具体价格请以官方为准。
Gemini 2.5 Flash的评测表现如何?▼
Gemini 2.5 Flash在多个基准测试中表现优秀:undefined: 75,undefined: 94,undefined: 87等。
Gemini 2.5 Flash有哪些主要功能?▼
高性能低成本、低延迟高吞吐、100万 token 上下文、多模态支持