导航菜单
切换主题

文本多模态

23 个模型

ERNIE-4.5-VL-424B-A47B

百度

ERNIE 4.5 VL 开源多模态模型

国内开源

ERNIE-4.5-VL-28B-A3B-Thinking

百度

ERNIE 4.5 VL 轻量多模态思考模型

国内开源

Qwen-Audio

阿里巴巴

通义千问音频理解模型

国内开源

Qwen-Audio-Chat

阿里巴巴

通义千问音频对话模型

国内开源

MiMo V2.5 ASR

小米

小米语音识别模型,支持中英双语、中文方言、Code-Switch,在强噪音、多说话人场景下表现优异

国内开源

LongCat-Flash-Chat

美团

MoE架构通用大语言模型,560B总参数,27B激活参数

国内开源
1,048,576

LongCat-Flash-Thinking

美团

深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

国内开源
1,048,576

LongCat-Flash-Omni

美团

全模态实时交互模型,支持文本、图像、音频输入

国内开源
1,048,576

Ling-1T

蚂蚁集团

MoE架构通用大语言模型,万亿参数规模

国内开源
32,768

Ling-Turbo

蚂蚁集团

轻量级通用模型,高效推理

国内开源
32,768

Ring-1T

蚂蚁集团

万亿参数思维模型,开源SOTA推理能力

国内开源
32,768

Ring-mini

蚂蚁集团

轻量级推理模型,适配复杂长序列解码场景

国内开源
32,768

Ming-Omni

蚂蚁集团

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

国内开源
32,768

InternLM-2.5

上海人工智能实验室

书生语言大模型,开源通用对话模型

国内开源
32,768

InternLM-XComposer

上海人工智能实验室

图文多模态模型,支持图文理解和生成

国内开源
8,192

Emu3

BAAI

原生多模态世界模型,文本、图像、视频统一生成

国内开源
8,192

BGE-Large

BAAI

通用向量模型,Hugging Face月度下载第一的国产模型

国内开源
512

Aquila-2

BAAI

悟道语言大模型,中文能力超过GPT-4的90%

国内开源
32,768

Tele-FLM-52B

BAAI

万亿参数稠密模型,训练成本降低一个数量级

国内开源
32,768

Pangu Pro MoE 72B

华为

华为盘古Pro MoE 72B开源模型

国内开源

Sarvam-2B

Sarvam AI

Sarvam AI印度语言模型

国内开源
8,192

Sarvam-2B-Chat

Sarvam AI

Sarvam AI对话模型

国内开源
8,192

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型

国内开源