Name: Nemotron-4-340B-Reward
Author: NVIDIA

Question 1

Nemotron-4-340B-Reward是什么？

Accepted Answer

Nemotron-4-340B-Reward 是NVIDIA的奖励模型，用于RLHF训练和内容质量评估。

Question 2

Nemotron-4-340B-Reward的核心参数是什么？

Accepted Answer

Nemotron-4-340B-Reward是NVIDIA推出的模型，上下文窗口4,096tokens，最大输出1tokens，开源模型。

Question 3

Nemotron-4-340B-Reward的API价格是多少？

Accepted Answer

Nemotron-4-340B-Reward是开源模型，可以免费下载使用。如需API服务，可使用各大推理平台提供的托管服务。

Question 4

Nemotron-4-340B-Reward有哪些主要功能？

Accepted Answer

奖励模型、RLHF训练、质量评估

Nemotron-4-340B-Reward

使用方法