文本多模态
共 23 个模型
◈
ERNIE-4.5-VL-424B-A47B
百度
ERNIE 4.5 VL 开源多模态模型
国内开源
◈
ERNIE-4.5-VL-28B-A3B-Thinking
百度
ERNIE 4.5 VL 轻量多模态思考模型
国内开源
◈
Qwen-Audio
阿里巴巴
通义千问音频理解模型
国内开源
◈
Qwen-Audio-Chat
阿里巴巴
通义千问音频对话模型
国内开源
◈
MiMo V2.5 ASR
小米
小米语音识别模型,支持中英双语、中文方言、Code-Switch,在强噪音、多说话人场景下表现优异
国内开源
◈
LongCat-Flash-Chat
美团
MoE架构通用大语言模型,560B总参数,27B激活参数
国内开源
1,048,576◈
LongCat-Flash-Thinking
美团
深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型
国内开源
1,048,576◈
LongCat-Flash-Omni
美团
全模态实时交互模型,支持文本、图像、音频输入
国内开源
1,048,576◈
Ling-1T
蚂蚁集团
MoE架构通用大语言模型,万亿参数规模
国内开源
32,768◈
Ling-Turbo
蚂蚁集团
轻量级通用模型,高效推理
国内开源
32,768◈
Ring-1T
蚂蚁集团
万亿参数思维模型,开源SOTA推理能力
国内开源
32,768◈
Ring-mini
蚂蚁集团
轻量级推理模型,适配复杂长序列解码场景
国内开源
32,768◈
Ming-Omni
蚂蚁集团
统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成
国内开源
32,768◈
InternLM-2.5
上海人工智能实验室
书生语言大模型,开源通用对话模型
国内开源
32,768◈
InternLM-XComposer
上海人工智能实验室
图文多模态模型,支持图文理解和生成
国内开源
8,192◈
Emu3
BAAI
原生多模态世界模型,文本、图像、视频统一生成
国内开源
8,192◈
BGE-Large
BAAI
通用向量模型,Hugging Face月度下载第一的国产模型
国内开源
512◈
Aquila-2
BAAI
悟道语言大模型,中文能力超过GPT-4的90%
国内开源
32,768◈
Tele-FLM-52B
BAAI
万亿参数稠密模型,训练成本降低一个数量级
国内开源
32,768◈
Pangu Pro MoE 72B
华为
华为盘古Pro MoE 72B开源模型
国内开源
◈
Sarvam-2B
Sarvam AI
Sarvam AI印度语言模型
国内开源
8,192◈
Sarvam-2B-Chat
Sarvam AI
Sarvam AI对话模型
国内开源
8,192◈
Skywork-R1V
昆仑万维
昆仑天工 R1V 多模态推理模型
国内开源