导航菜单
切换主题

💬 大语言模型

34 个模型

其他模型(34)

DeepSeek R1

DeepSeek·2025-01

DeepSeek R1 是 DeepSeek 的推理模型,通过链式思考实现强大的逻辑推理能力。

国内开源
64,000

DeepSeek V3

DeepSeek·2024-12

DeepSeek V3 是 DeepSeek 的经典通用模型,以极低价格提供强大性能。

国内开源
164,000

DeepSeek Coder V2

DeepSeek·2024-06

DeepSeek Coder V2 是专为代码生成和理解优化的模型,支持多种编程语言。

国内开源
128,000

ERNIE-4.5-300B-A47B-Base

百度

ERNIE 4.5 300B 开源基础模型

国内开源

ERNIE-4.5-300B-A47B

百度

ERNIE 4.5 300B 开源指令模型

国内开源

ERNIE-4.5-21B-A3B-Base

百度

ERNIE 4.5 21B 轻量开源模型

国内开源

ERNIE-4.5-VL-424B-A47B

百度

ERNIE 4.5 VL 开源多模态模型

国内开源

ERNIE-4.5-VL-28B-A3B-Thinking

百度

ERNIE 4.5 VL 轻量多模态思考模型

国内开源

ERNIE-4.5-0.3B

百度

ERNIE 4.5 0.3B 超轻量模型

国内开源

Qwen-Audio

阿里巴巴

通义千问音频理解模型

国内开源

Qwen-Audio-Chat

阿里巴巴

通义千问音频对话模型

国内开源

Qwen-Coder

阿里巴巴

通义千问代码生成模型

国内开源

Qwen-Math

阿里巴巴

通义千问数学推理模型

国内开源

LongCat-Flash-Chat

美团

MoE架构通用大语言模型,560B总参数,27B激活参数

国内开源
1,048,576

LongCat-Flash-Thinking

美团

深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

国内开源
1,048,576

LongCat-Flash-Omni

美团

全模态实时交互模型,支持文本、图像、音频输入

国内开源
1,048,576

Ling-1T

蚂蚁集团

MoE架构通用大语言模型,万亿参数规模

国内开源
32,768

Ling-Turbo

蚂蚁集团

轻量级通用模型,高效推理

国内开源
32,768

Ring-1T

蚂蚁集团

万亿参数思维模型,开源SOTA推理能力

国内开源
32,768

Ring-mini

蚂蚁集团

轻量级推理模型,适配复杂长序列解码场景

国内开源
32,768

Ming-Omni

蚂蚁集团

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

国内开源
32,768

InternVL-2.0

上海人工智能实验室

书生·万象多模态大模型,支持图像、视频、文字、语音、3D点云

国内开源
8,192

InternLM-2.5

上海人工智能实验室

书生语言大模型,开源通用对话模型

国内开源
32,768

InternLM-XComposer

上海人工智能实验室

图文多模态模型,支持图文理解和生成

国内开源
8,192

Emu3

BAAI

原生多模态世界模型,文本、图像、视频统一生成

国内开源
8,192

Aquila-2

BAAI

悟道语言大模型,中文能力超过GPT-4的90%

国内开源
32,768

Tele-FLM-52B

BAAI

万亿参数稠密模型,训练成本降低一个数量级

国内开源
32,768

Pangu Pro MoE 72B

华为

华为盘古Pro MoE 72B开源模型

国内开源

Sarvam-2B

Sarvam AI

Sarvam AI印度语言模型

国内开源
8,192

Sarvam-2B-Chat

Sarvam AI

Sarvam AI对话模型

国内开源
8,192

Skywork-MoE

昆仑万维

昆仑天工 MoE 稀疏大模型

国内开源

Skywork-OR1-Math-7B

昆仑万维

昆仑天工 OR1 数学推理模型 7B

国内开源

Skywork-OR1-32B

昆仑万维

昆仑天工 OR1 数学代码推理模型 32B

国内开源

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型

国内开源