导航菜单
切换主题
Gemini 2.5 Flash

Gemini 2.5 Flash

高性能低成本的多模态模型,适合大规模部署

Gemini 2.5 Flash 是一款轻量级多模态模型,在保持高质量输出的同时提供更低的延迟和成本。它同样支持 100 万 token 上下文,非常适合需要快速响应的生产环境应用。

核心参数

上下文窗口
1,048,576
最大输出
65,536
输入模态
文本
开源状态
闭源

规格信息

架构类型
Dense 架构

评测数据

评测分类

MMLU

88.0%良好

GSM8K

94.0%优秀

MATH

80.0%良好

GPQA

75.0%良好

HumanEval

87.0%良好
优秀
良好
一般
较差
很低

API 定价

国际定价(单位:$/Mtoken)

标准Mtoken
输入
$0.075
输出
$0.3

功能特性

高性能低成本

在保持高质量的同时提供极具竞争力的价格

低延迟高吞吐

优化的推理速度,适合大规模并发

100万 token 上下文

支持长文档和复杂上下文处理

多模态支持

支持文本、图像、音频、视频输入

适用场景

初创企业

需要性价比高的 AI 解决方案

高并发应用

聊天机器人、实时翻译、内容生成

开发者

快速原型开发和生产部署

同厂商系列对比

系列代表模型上下文输入价格输出价格
Gemini 2.5Gemini 2.5 Flash1,048,576$0.075/Mtoken$0.3/Mtoken
Gemini 3.1Gemini 3.1 Pro Preview1,048,576$2/Mtoken$12/Mtoken
Gemini 3Gemini 3 Flash Preview1,048,576$0.5/Mtoken$3/Mtoken
Gemini 2.0Gemini 2.0 Flash1,048,576$0.1/Mtoken$0.4/Mtoken

常见问题

Gemini 2.5 Flash是什么?
Gemini 2.5 Flash 是一款轻量级多模态模型,在保持高质量输出的同时提供更低的延迟和成本。它同样支持 100 万 token 上下文,非常适合需要快速响应的生产环境应用。
Gemini 2.5 Flash的核心参数是什么?
Gemini 2.5 Flash是Google推出的模型,上下文窗口1,048,576tokens,最大输出65,536tokens,闭源模型。
Gemini 2.5 Flash的API价格是多少?
Gemini 2.5 Flash的API调用价格约为$75.00/Mtoken(输入)。具体价格请以官方为准。
Gemini 2.5 Flash的评测表现如何?
Gemini 2.5 Flash在多个基准测试中表现优秀:undefined: 75,undefined: 94,undefined: 87等。
Gemini 2.5 Flash有哪些主要功能?
高性能低成本、低延迟高吞吐、100万 token 上下文、多模态支持
最后更新:2026/5/6数据来源:即客AI模型库官网验证 ↗API文档 ↗