HY 3.0 Preview是腾讯混元系列的最新预览版本,在推理能力、代码生成和多轮对话方面有显著提升。
核心参数
上下文窗口
256,000
最大输出
8,192
输入模态
文本
开源状态
闭源
评测数据
评测分类
MMLU
87.4%良好
↑ 越高越好
MMLU-Pro
65.8%一般
↑ 越高越好
GSM8K
95.4%优秀
↑ 越高越好
MATH
76.3%良好
↑ 越高越好
GPQA
50.0%较差
↑ 越高越好
ARC-Challenge
78.0%良好
↑ 越高越好
HellaSwag
82.0%良好
↑ 越高越好
WinoGrande
80.0%良好
↑ 越高越好
TruthfulQA
65.0%一般
↑ 越高越好
HumanEval
75.0%良好
↑ 越高越好
MBPP
78.7%良好
↑ 越高越好
LiveCodeBench
45.0%较差
↑ 越高越好
C-Eval
89.8%良好
↑ 越高越好
CMMLU
89.6%良好
↑ 越高越好
Gaokao
75.0%良好
↑ 越高越好
CMath
91.2%优秀
↑ 越高越好
SWE-bench Verified
35.0%很低
↑ 越高越好
SWE-bench Multilingual
40.0%较差
↑ 越高越好
Aider Polyglot
45.0%较差
↑ 越高越好
Humanity Last Exam
15.0%很低
↑ 越高越好
BFCL
60.0%一般
↑ 越高越好
GPQA Diamond
45.0%较差
↑ 越高越好
优秀
良好
一般
较差
很低
常见问题
HY 3.0 Preview是什么?▼
HY 3.0 Preview是腾讯混元系列的最新预览版本,在推理能力、代码生成和多轮对话方面有显著提升。
HY 3.0 Preview的核心参数是什么?▼
HY 3.0 Preview是腾讯推出的模型,上下文窗口256,000tokens,最大输出8,192tokens,闭源模型。
HY 3.0 Preview的评测表现如何?▼
HY 3.0 Preview在多个基准测试中表现优秀:undefined: 45,undefined: 78,undefined: 60等。
