O1 是 OpenAI 的推理模型,针对需要深度思考和复杂推理的任务设计。
核心参数
输入模态
文本
开源状态
闭源
评测数据
评测分类
MMLU
90.0%优秀
↑ 越高越好
MMLU-Pro
78.0%良好
↑ 越高越好
GSM8K
97.0%优秀
↑ 越高越好
MATH
92.0%优秀
↑ 越高越好
AIME
70.0%一般
↑ 越高越好
GPQA
72.0%一般
↑ 越高越好
ARC-Challenge
96.0%优秀
↑ 越高越好
HellaSwag
95.0%优秀
↑ 越高越好
WinoGrande
89.0%良好
↑ 越高越好
BBH
89.0%良好
↑ 越高越好
TruthfulQA
85.0%良好
↑ 越高越好
HumanEval
92.0%优秀
↑ 越高越好
MBPP
90.0%优秀
↑ 越高越好
MultiPL-E
86.0%良好
↑ 越高越好
LiveCodeBench
80.0%良好
↑ 越高越好
Needle in a Haystack
98.0%优秀
↑ 越高越好
LongBench
72.0%一般
↑ 越高越好
RULER
90.0%优秀
↑ 越高越好
C-Eval
80.0%良好
↑ 越高越好
CMMLU
80.0%良好
↑ 越高越好
Gaokao
76.0%良好
↑ 越高越好
CMath
88.0%良好
↑ 越高越好
SWE-bench Verified
85.0%良好
↑ 越高越好
SWE-bench Pro
45.0%较差
↑ 越高越好
SWE-bench Multilingual
79.0%良好
↑ 越高越好
Aider Polyglot
84.2%良好
↑ 越高越好
ARC-AGI-2
25.0%很低
↑ 越高越好
Humanity Last Exam
22.0%很低
↑ 越高越好
OSWorld
18.0%很低
↑ 越高越好
WebArena
22.0%很低
↑ 越高越好
BFCL
80.0%良好
↑ 越高越好
GPQA Diamond
72.0%一般
↑ 越高越好
优秀
良好
一般
较差
很低
API 定价
国际定价(单位:$/Mtoken)
标准Mtoken
输入
$15
输出
$60
功能特性
深度推理
深度思考和推理能力
复杂问题
复杂问题求解
多步推理
多步骤推理链
验证能力
推理结果验证
适用场景
研究人员
复杂问题研究
分析师
深度分析任务
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| O-Series | O1 | - | $15/Mtoken | $60/Mtoken |
| GPT-5 Mini | GPT-5.4 Nano | 128,000 | $0.2/Mtoken | $1.25/Mtoken |
常见问题
O1是什么?▼
O1 是 OpenAI 的推理模型,针对需要深度思考和复杂推理的任务设计。
O1的核心参数是什么?▼
O1是OpenAI推出的模型,闭源模型。
O1的API价格是多少?▼
O1的API调用价格约为$15000.00/Mtoken(输入)。具体价格请以官方为准。
O1的评测表现如何?▼
O1在多个基准测试中表现优秀:undefined: 84.2,undefined: 70,undefined: 25等。
O1有哪些主要功能?▼
深度推理、复杂问题、多步推理、验证能力
最后更新:2026/5/6数据来源:即客AI模型库
