💬 大语言模型
共 34 个模型
其他模型(34)
◈
DeepSeek R1
DeepSeek·2025-01
DeepSeek R1 是 DeepSeek 的推理模型,通过链式思考实现强大的逻辑推理能力。
国内开源
64,000◈
DeepSeek V3
DeepSeek·2024-12
DeepSeek V3 是 DeepSeek 的经典通用模型,以极低价格提供强大性能。
国内开源
164,000◈
DeepSeek Coder V2
DeepSeek·2024-06
DeepSeek Coder V2 是专为代码生成和理解优化的模型,支持多种编程语言。
国内开源
128,000◈
ERNIE-4.5-300B-A47B-Base
百度
ERNIE 4.5 300B 开源基础模型
国内开源
◈
ERNIE-4.5-300B-A47B
百度
ERNIE 4.5 300B 开源指令模型
国内开源
◈
ERNIE-4.5-21B-A3B-Base
百度
ERNIE 4.5 21B 轻量开源模型
国内开源
◈
ERNIE-4.5-VL-424B-A47B
百度
ERNIE 4.5 VL 开源多模态模型
国内开源
◈
ERNIE-4.5-VL-28B-A3B-Thinking
百度
ERNIE 4.5 VL 轻量多模态思考模型
国内开源
◈
ERNIE-4.5-0.3B
百度
ERNIE 4.5 0.3B 超轻量模型
国内开源
◈
Qwen-Audio
阿里巴巴
通义千问音频理解模型
国内开源
◈
Qwen-Audio-Chat
阿里巴巴
通义千问音频对话模型
国内开源
◈
Qwen-Coder
阿里巴巴
通义千问代码生成模型
国内开源
◈
Qwen-Math
阿里巴巴
通义千问数学推理模型
国内开源
◈
LongCat-Flash-Chat
美团
MoE架构通用大语言模型,560B总参数,27B激活参数
国内开源
1,048,576◈
LongCat-Flash-Thinking
美团
深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型
国内开源
1,048,576◈
LongCat-Flash-Omni
美团
全模态实时交互模型,支持文本、图像、音频输入
国内开源
1,048,576◈
Ling-1T
蚂蚁集团
MoE架构通用大语言模型,万亿参数规模
国内开源
32,768◈
Ling-Turbo
蚂蚁集团
轻量级通用模型,高效推理
国内开源
32,768◈
Ring-1T
蚂蚁集团
万亿参数思维模型,开源SOTA推理能力
国内开源
32,768◈
Ring-mini
蚂蚁集团
轻量级推理模型,适配复杂长序列解码场景
国内开源
32,768◈
Ming-Omni
蚂蚁集团
统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成
国内开源
32,768◈
InternVL-2.0
上海人工智能实验室
书生·万象多模态大模型,支持图像、视频、文字、语音、3D点云
国内开源
8,192◈
InternLM-2.5
上海人工智能实验室
书生语言大模型,开源通用对话模型
国内开源
32,768◈
InternLM-XComposer
上海人工智能实验室
图文多模态模型,支持图文理解和生成
国内开源
8,192◈
Emu3
BAAI
原生多模态世界模型,文本、图像、视频统一生成
国内开源
8,192◈
Aquila-2
BAAI
悟道语言大模型,中文能力超过GPT-4的90%
国内开源
32,768◈
Tele-FLM-52B
BAAI
万亿参数稠密模型,训练成本降低一个数量级
国内开源
32,768◈
Pangu Pro MoE 72B
华为
华为盘古Pro MoE 72B开源模型
国内开源
◈
Sarvam-2B
Sarvam AI
Sarvam AI印度语言模型
国内开源
8,192◈
Sarvam-2B-Chat
Sarvam AI
Sarvam AI对话模型
国内开源
8,192◈
Skywork-MoE
昆仑万维
昆仑天工 MoE 稀疏大模型
国内开源
◈
Skywork-OR1-Math-7B
昆仑万维
昆仑天工 OR1 数学推理模型 7B
国内开源
◈
Skywork-OR1-32B
昆仑万维
昆仑天工 OR1 数学代码推理模型 32B
国内开源
◈
Skywork-R1V
昆仑万维
昆仑天工 R1V 多模态推理模型
国内开源