文本LLM
共 24 个模型
◈
DeepSeek R1
DeepSeek·2025-01
DeepSeek R1 是 DeepSeek 的推理模型,通过链式思考实现强大的逻辑推理能力。
国内开源
64,000◈
Llama 3.3 70B
Meta·2024-12
Llama 3.3 是一个 70B 参数的文本指令微调模型,性能接近 Llama 3.1 405B,但成本仅为后者的一小部分。
国外开源
128,000◈
DeepSeek V3
DeepSeek·2024-12
DeepSeek V3 是 DeepSeek 的经典通用模型,以极低价格提供强大性能。
国内开源
164,000◈
Llama 3.1 405B
Meta·2024-07
Llama 3.1 405B 是 Meta 最大的开源模型,4050 亿参数,在多项基准测试中媲美 GPT-4 和 Claude 3。
国外开源
128,000◈
Llama 3.1 70B
Meta·2024-07
Llama 3.1 70B 是高性能与效率的平衡选择,在大多数任务上表现优秀,同时保持了较低的部署成本。
国外开源
128,000◈
Llama 3.1 8B
Meta·2024-07
Llama 3.1 8B 是最轻量的 Llama 3.1 模型,适合边缘部署和资源受限环境。
国外开源
128,000◈
Gemma 2 27B
Google
Google 开源的高性能轻量级模型
国外开源
8,192◈
Gemma 2 9B
Google
Google 开源的轻量级模型,适合边缘设备部署
国外开源
8,192◈
ERNIE-4.5-300B-A47B-Base
百度
ERNIE 4.5 300B 开源基础模型
国内开源
◈
ERNIE-4.5-300B-A47B
百度
ERNIE 4.5 300B 开源指令模型
国内开源
◈
ERNIE-4.5-21B-A3B-Base
百度
ERNIE 4.5 21B 轻量开源模型
国内开源
◈
ERNIE-4.5-0.3B
百度
ERNIE 4.5 0.3B 超轻量模型
国内开源
◈
Gemma 4
Google
Google 最新开源大语言模型
国外开源
8,192◈
Gemma 3
Google
Google 开源大语言模型
国外开源
8,192◈
Qwen-Coder
阿里巴巴
通义千问代码生成模型
国内开源
◈
Qwen-Math
阿里巴巴
通义千问数学推理模型
国内开源
◈
Mixtral 8x22B
Mistral AI
Mistral AI Mixtral 8x22B 开源模型
国外开源
66,000◈
Skywork-MoE
昆仑万维
昆仑天工 MoE 稀疏大模型
国内开源
◈
Skywork-OR1-Math-7B
昆仑万维
昆仑天工 OR1 数学推理模型 7B
国内开源
◈
Skywork-OR1-32B
昆仑万维
昆仑天工 OR1 数学代码推理模型 32B
国内开源
◈
Nemotron-4-340B
NVIDIA
NVIDIA Nemotron-4 340B 大语言模型
国外开源
◈
Llama-3.1-NIM
NVIDIA
NVIDIA NIM Llama 3.1 托管服务
国外开源
◈
Jamba-1.5-Large
AI21 Labs
AI21 Jamba 1.5 Large MoE 模型
国外开源
262,144◈
Jamba-1.5-Mini
AI21 Labs
AI21 Jamba 1.5 Mini 轻量模型
国外开源