导航菜单
切换主题

文本LLM

24 个模型

DeepSeek R1

DeepSeek·2025-01

DeepSeek R1 是 DeepSeek 的推理模型,通过链式思考实现强大的逻辑推理能力。

国内开源
64,000

Llama 3.3 70B

Meta·2024-12

Llama 3.3 是一个 70B 参数的文本指令微调模型,性能接近 Llama 3.1 405B,但成本仅为后者的一小部分。

国外开源
128,000

DeepSeek V3

DeepSeek·2024-12

DeepSeek V3 是 DeepSeek 的经典通用模型,以极低价格提供强大性能。

国内开源
164,000

Llama 3.1 405B

Meta·2024-07

Llama 3.1 405B 是 Meta 最大的开源模型,4050 亿参数,在多项基准测试中媲美 GPT-4 和 Claude 3。

国外开源
128,000

Llama 3.1 70B

Meta·2024-07

Llama 3.1 70B 是高性能与效率的平衡选择,在大多数任务上表现优秀,同时保持了较低的部署成本。

国外开源
128,000

Llama 3.1 8B

Meta·2024-07

Llama 3.1 8B 是最轻量的 Llama 3.1 模型,适合边缘部署和资源受限环境。

国外开源
128,000

Gemma 2 27B

Google

Google 开源的高性能轻量级模型

国外开源
8,192

Gemma 2 9B

Google

Google 开源的轻量级模型,适合边缘设备部署

国外开源
8,192

ERNIE-4.5-300B-A47B-Base

百度

ERNIE 4.5 300B 开源基础模型

国内开源

ERNIE-4.5-300B-A47B

百度

ERNIE 4.5 300B 开源指令模型

国内开源

ERNIE-4.5-21B-A3B-Base

百度

ERNIE 4.5 21B 轻量开源模型

国内开源

ERNIE-4.5-0.3B

百度

ERNIE 4.5 0.3B 超轻量模型

国内开源

Gemma 4

Google

Google 最新开源大语言模型

国外开源
8,192

Gemma 3

Google

Google 开源大语言模型

国外开源
8,192

Qwen-Coder

阿里巴巴

通义千问代码生成模型

国内开源

Qwen-Math

阿里巴巴

通义千问数学推理模型

国内开源

Mixtral 8x22B

Mistral AI

Mistral AI Mixtral 8x22B 开源模型

国外开源
66,000

Skywork-MoE

昆仑万维

昆仑天工 MoE 稀疏大模型

国内开源

Skywork-OR1-Math-7B

昆仑万维

昆仑天工 OR1 数学推理模型 7B

国内开源

Skywork-OR1-32B

昆仑万维

昆仑天工 OR1 数学代码推理模型 32B

国内开源

Nemotron-4-340B

NVIDIA

NVIDIA Nemotron-4 340B 大语言模型

国外开源

Llama-3.1-NIM

NVIDIA

NVIDIA NIM Llama 3.1 托管服务

国外开源

Jamba-1.5-Large

AI21 Labs

AI21 Jamba 1.5 Large MoE 模型

国外开源
262,144

Jamba-1.5-Mini

AI21 Labs

AI21 Jamba 1.5 Mini 轻量模型

国外开源