文本LLM

共 24 个模型

DeepSeek R1

DeepSeek·2025-01

DeepSeek R1 是 DeepSeek 的推理模型，通过链式思考实现强大的逻辑推理能力。

国内开源

64,000

◈

Llama 3.3 70B

Meta·2024-12

Llama 3.3 是一个 70B 参数的文本指令微调模型，性能接近 Llama 3.1 405B，但成本仅为后者的一小部分。

国外开源

128,000

◈

DeepSeek V3

DeepSeek·2024-12

DeepSeek V3 是 DeepSeek 的经典通用模型，以极低价格提供强大性能。

国内开源

164,000

◈

Llama 3.1 405B

Meta·2024-07

Llama 3.1 405B 是 Meta 最大的开源模型，4050 亿参数，在多项基准测试中媲美 GPT-4 和 Claude 3。

国外开源

128,000

◈

Llama 3.1 70B

Meta·2024-07

Llama 3.1 70B 是高性能与效率的平衡选择，在大多数任务上表现优秀，同时保持了较低的部署成本。

国外开源

128,000

◈

Llama 3.1 8B

Meta·2024-07

Llama 3.1 8B 是最轻量的 Llama 3.1 模型，适合边缘部署和资源受限环境。

国外开源

128,000

◈

Gemma 2 27B

Google 开源的高性能轻量级模型

Gemma 2 9B

Google

Google 开源的轻量级模型，适合边缘设备部署

国外开源

8,192

◈

ERNIE-4.5-300B-A47B-Base

百度

ERNIE 4.5 300B 开源基础模型

国内开源

◈

ERNIE-4.5-300B-A47B

百度

ERNIE 4.5 300B 开源指令模型

国内开源

◈

ERNIE-4.5-21B-A3B-Base

百度

ERNIE 4.5 21B 轻量开源模型

国内开源

◈

ERNIE-4.5-0.3B

百度

ERNIE 4.5 0.3B 超轻量模型

国内开源

◈

Gemma 4

Google 最新开源大语言模型

Gemma 3

Google 开源大语言模型

Qwen-Coder

阿里巴巴

通义千问代码生成模型

国内开源

◈

Qwen-Math

阿里巴巴

通义千问数学推理模型

国内开源

◈

Mixtral 8x22B

Mistral AI

Mistral AI Mixtral 8x22B 开源模型

国外开源

66,000

◈

Skywork-MoE

昆仑万维

昆仑天工 MoE 稀疏大模型

国内开源

◈

Skywork-OR1-Math-7B

昆仑万维

昆仑天工 OR1 数学推理模型 7B

国内开源

◈

Skywork-OR1-32B

昆仑万维

昆仑天工 OR1 数学代码推理模型 32B

国内开源

◈

Nemotron-4-340B

NVIDIA

NVIDIA Nemotron-4 340B 大语言模型

国外开源

◈

Llama-3.1-NIM

NVIDIA

NVIDIA NIM Llama 3.1 托管服务

国外开源

◈

Jamba-1.5-Large

AI21 Labs

AI21 Jamba 1.5 Large MoE 模型

国外开源

262,144

◈

Jamba-1.5-Mini

AI21 Labs

AI21 Jamba 1.5 Mini 轻量模型

国外开源