导航菜单
切换主题

💬 大语言模型

75 个模型

其他模型(75)

Llama 4

主流
Meta

Meta最新旗舰Llama 4模型

LLM国外开源
256,000

DeepSeek R1

DeepSeek·2025-01

DeepSeek R1 是 DeepSeek 的推理模型,通过链式思考实现强大的逻辑推理能力。

国内开源
64,000

Llama 3.3 70B

Meta·2024-12

Llama 3.3 是一个 70B 参数的文本指令微调模型,性能接近 Llama 3.1 405B,但成本仅为后者的一小部分。

国外开源
128,000

DeepSeek V3

DeepSeek·2024-12

DeepSeek V3 是 DeepSeek 的经典通用模型,以极低价格提供强大性能。

国内开源
164,000

Llama 3.2 90B Vision

Meta·2024-09

Llama 3.2 90B Vision 是 Meta 最大的多模态模型,支持图像推理任务,如文档理解、图像描述和视觉定位。

国外开源
128,000

Llama 3.2 11B Vision

Meta·2024-09

Llama 3.2 11B Vision 是中等规模的多模态模型,在图像推理任务上表现优秀,适合需要视觉能力的应用场景。

国外开源
128,000

Llama 3.1 405B

Meta·2024-07

Llama 3.1 405B 是 Meta 最大的开源模型,4050 亿参数,在多项基准测试中媲美 GPT-4 和 Claude 3。

国外开源
128,000

Llama 3.1 70B

Meta·2024-07

Llama 3.1 70B 是高性能与效率的平衡选择,在大多数任务上表现优秀,同时保持了较低的部署成本。

国外开源
128,000

Llama 3.1 8B

Meta·2024-07

Llama 3.1 8B 是最轻量的 Llama 3.1 模型,适合边缘部署和资源受限环境。

国外开源
128,000

DeepSeek Coder V2

DeepSeek·2024-06

DeepSeek Coder V2 是专为代码生成和理解优化的模型,支持多种编程语言。

国内开源
128,000

Molmo-7B-D

AI2

AI2 Molmo-7B对话版

国外开源

Gemma 2 27B

Google

Google 开源的高性能轻量级模型

国外开源
8,192

Gemma 2 9B

Google

Google 开源的轻量级模型,适合边缘设备部署

国外开源
8,192

MiniCPM-2.4B

OpenBMB

OpenBMB小型CPM模型

国外开源
4,096

Granite 3.3 MoE

IBM

IBM Granite MoE模型

国外开源
128,000

ERNIE-4.5-300B-A47B-Base

百度

ERNIE 4.5 300B 开源基础模型

国内开源

ERNIE-4.5-300B-A47B

百度

ERNIE 4.5 300B 开源指令模型

国内开源

ERNIE-4.5-21B-A3B-Base

百度

ERNIE 4.5 21B 轻量开源模型

国内开源

ERNIE-4.5-VL-424B-A47B

百度

ERNIE 4.5 VL 开源多模态模型

国内开源

ERNIE-4.5-VL-28B-A3B-Thinking

百度

ERNIE 4.5 VL 轻量多模态思考模型

国内开源

ERNIE-4.5-0.3B

百度

ERNIE 4.5 0.3B 超轻量模型

国内开源

Gemma 4

Google

Google 最新开源大语言模型

国外开源
8,192

Gemma 3

Google

Google 开源大语言模型

国外开源
8,192

Qwen-Audio

阿里巴巴

通义千问音频理解模型

国内开源

Qwen-Audio-Chat

阿里巴巴

通义千问音频对话模型

国内开源

Qwen-Coder

阿里巴巴

通义千问代码生成模型

国内开源

Qwen-Math

阿里巴巴

通义千问数学推理模型

国内开源

LongCat-Flash-Chat

美团

MoE架构通用大语言模型,560B总参数,27B激活参数

国内开源
1,048,576

LongCat-Flash-Thinking

美团

深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

国内开源
1,048,576

LongCat-Flash-Omni

美团

全模态实时交互模型,支持文本、图像、音频输入

国内开源
1,048,576

Ling-1T

蚂蚁集团

MoE架构通用大语言模型,万亿参数规模

国内开源
32,768

Ling-Turbo

蚂蚁集团

轻量级通用模型,高效推理

国内开源
32,768

Ring-1T

蚂蚁集团

万亿参数思维模型,开源SOTA推理能力

国内开源
32,768

Ring-mini

蚂蚁集团

轻量级推理模型,适配复杂长序列解码场景

国内开源
32,768

Ming-Omni

蚂蚁集团

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

国内开源
32,768

InternVL-2.0

上海人工智能实验室

书生·万象多模态大模型,支持图像、视频、文字、语音、3D点云

国内开源
8,192

InternLM-2.5

上海人工智能实验室

书生语言大模型,开源通用对话模型

国内开源
32,768

Mixtral 8x22B

Mistral AI

Mistral AI Mixtral 8x22B 开源模型

国外开源
66,000

InternLM-XComposer

上海人工智能实验室

图文多模态模型,支持图文理解和生成

国内开源
8,192

Emu3

BAAI

原生多模态世界模型,文本、图像、视频统一生成

国内开源
8,192

Aquila-2

BAAI

悟道语言大模型,中文能力超过GPT-4的90%

国内开源
32,768

Tele-FLM-52B

BAAI

万亿参数稠密模型,训练成本降低一个数量级

国内开源
32,768

Pangu Pro MoE 72B

华为

华为盘古Pro MoE 72B开源模型

国内开源

Llama 4 Scout

Meta

Meta轻量版Llama 4模型

国外开源
256,000

Llama 4 Maverick

Meta

Meta中等规模Llama 4模型

国外开源
256,000

Llama 3.3 8B

Meta

Meta小规模Llama 3.3模型

国外开源
128,000

Pixtral 12B

Mistral AI

Mistral AI多模态轻量模型

国外开源
128,000

Nemotron-VLM

NVIDIA

NVIDIA视觉语言模型

国外开源
8,192

Phi-4

Microsoft

Microsoft小型高效模型

国外开源
128,000

Phi-4 Mini

Microsoft

Microsoft超小型模型

国外开源
128,000

Phi-3.5-MoE

Microsoft

Microsoft MoE架构模型

国外开源
128,000

Phi-3.5-Vision

Microsoft

Microsoft多模态模型

国外开源
128,000

Phi-3.5-Mini

Microsoft

Microsoft轻量版模型

国外开源
128,000

Jamba-1-9B

AI21 Labs

AI21小规模Jamba模型

国外开源
256,000

Molmo-72B

AI2

AI2开源多模态模型

国外开源

Molmo-7B

AI2

AI2轻量多模态模型

国外开源

Granite 3.3

IBM

IBM企业级大模型

国外开源
128,000

Granite Code

IBM

IBM代码生成模型

国外开源
128,000

h2oGPT

H2O.ai

H2O.ai开源企业模型

国外开源
4,096

MiniCPM-V

OpenBMB

OpenBMB多模态模型

国外开源

MiniCPM

OpenBMB

OpenBMB小型高效模型

国外开源

Sarvam-2B

Sarvam AI

Sarvam AI印度语言模型

国内开源
8,192

Falcon 3

TII

TII Falcon系列最新模型

国外开源
128,000

Zephyr 7B

Hugging Face

Hugging Face开源对话模型

国外开源
32,768

Sarvam-2B-Chat

Sarvam AI

Sarvam AI对话模型

国内开源
8,192

Falcon 3 10B

TII

TII Falcon 3 10B模型

国外开源
128,000

h2oVL

H2O.ai

H2O.ai视觉语言模型

国外开源
8,192

Skywork-MoE

昆仑万维

昆仑天工 MoE 稀疏大模型

国内开源

Skywork-OR1-Math-7B

昆仑万维

昆仑天工 OR1 数学推理模型 7B

国内开源

Skywork-OR1-32B

昆仑万维

昆仑天工 OR1 数学代码推理模型 32B

国内开源

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型

国内开源

Nemotron-4-340B

NVIDIA

NVIDIA Nemotron-4 340B 大语言模型

国外开源

Llama-3.1-NIM

NVIDIA

NVIDIA NIM Llama 3.1 托管服务

国外开源

Jamba-1.5-Large

AI21 Labs

AI21 Jamba 1.5 Large MoE 模型

国外开源
262,144

Jamba-1.5-Mini

AI21 Labs

AI21 Jamba 1.5 Mini 轻量模型

国外开源