O4 Mini 是轻量级的推理模型,在保持推理能力的同时提供更好的成本效益。
核心参数
上下文窗口
200,000
最大输出
100,000
输入模态
文本
开源状态
闭源
评测数据
评测分类
MMLU
88.0%良好
↑ 越高越好
MMLU-Pro
80.5%良好
↑ 越高越好
GSM8K
96.0%优秀
↑ 越高越好
MATH
88.0%良好
↑ 越高越好
AIME
60.0%一般
↑ 越高越好
AMC
88.0%良好
↑ 越高越好
GPQA
68.0%一般
↑ 越高越好
ARC-Challenge
93.0%优秀
↑ 越高越好
HellaSwag
92.0%优秀
↑ 越高越好
WinoGrande
87.0%良好
↑ 越高越好
BBH
88.0%良好
↑ 越高越好
TruthfulQA
80.0%良好
↑ 越高越好
HumanEval
82.0%良好
↑ 越高越好
HumanEval+
88.5%良好
↑ 越高越好
MBPP
86.2%良好
↑ 越高越好
MultiPL-E
82.0%良好
↑ 越高越好
LiveCodeBench
82.0%良好
↑ 越高越好
Needle in a Haystack
97.5%优秀
↑ 越高越好
LongBench
68.0%一般
↑ 越高越好
RULER
88.0%良好
↑ 越高越好
C-Eval
78.0%良好
↑ 越高越好
SWE-bench Verified
55.0%较差
↑ 越高越好
SWE-bench Multilingual
77.0%良好
↑ 越高越好
Aider Polyglot
88.5%良好
↑ 越高越好
Humanity Last Exam
20.0%很低
↑ 越高越好
BFCL
78.0%良好
↑ 越高越好
GPQA Diamond
68.0%一般
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
国际定价(单位:$/Mtoken)
标准Mtoken
输入
$1.1
输出
$4.4
功能特性
轻量推理
低成本推理能力
快速响应
快速推理响应
成本效益
推理任务性价比高
数学推理
良好的数学推理
适用场景
开发者
推理任务应用
学生
数学和学习辅助
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| O-Series | O4 Mini | 200,000 | $1.1/Mtoken | $4.4/Mtoken |
| GPT-5 Mini | GPT-5.4 Nano | 128,000 | $0.2/Mtoken | $1.25/Mtoken |
常见问题
O4 Mini是什么?▼
O4 Mini 是轻量级的推理模型,在保持推理能力的同时提供更好的成本效益。
O4 Mini的核心参数是什么?▼
O4 Mini是OpenAI推出的模型,上下文窗口200,000tokens,最大输出100,000tokens,闭源模型。
O4 Mini的API价格是多少?▼
O4 Mini的API调用价格约为$1100.00/Mtoken(输入)。具体价格请以官方为准。
O4 Mini的评测表现如何?▼
O4 Mini在多个基准测试中表现优秀:undefined: 88.5,undefined: 60,undefined: 88等。
O4 Mini有哪些主要功能?▼
轻量推理、快速响应、成本效益、数学推理
最后更新:2026/5/6数据来源:即客AI模型库
