导航菜单
切换主题

文本多模态

108 个模型

HY 3.0 Preview

腾讯·2026-05

腾讯混元3.0预览版,腾讯最新一代大语言模型,提供更强大的理解和生成能力。

国内闭源
256,000

ERNIE 5.1

百度

文心系列最新模型,基础能力全面升级,在智能体、知识、推理、深度搜索等方面均有显著提升

国内闭源
131,072

Kimi K2.5

月之暗面

月之暗面最新的 Kimi K2.5 模型

国内闭源
262,144

Kimi K2.6

月之暗面

月之暗面 Kimi K2.6 最新旗舰模型

国内部分开源
256,000

ERNIE-4.5-VL-424B-A47B

百度

ERNIE 4.5 VL 开源多模态模型

国内开源

ERNIE-4.5-VL-28B-A3B-Thinking

百度

ERNIE 4.5 VL 轻量多模态思考模型

国内开源

Doubao-Seed-2.0

字节跳动

豆包 Seed 2.0 旗舰级 Agent 通用模型

国内闭源

Doubao-Vision

字节跳动

豆包视觉理解模型

国内闭源

Doubao-3D-Generation

字节跳动

豆包3D生成模型

国内闭源

Qwen-Audio

阿里巴巴

通义千问音频理解模型

国内开源

Qwen-Audio-Chat

阿里巴巴

通义千问音频对话模型

国内开源

Qwen-VL-Plus

阿里巴巴

通义千问视觉理解增强版

国内闭源
32,768

Kimi K2.5 Thinking

月之暗面

Kimi K2.5的推理增强版本,支持深度思考模式,具备更强的逻辑推理和数学能力

国内闭源
262,144

Kimi K2.6 Thinking

月之暗面

Kimi K2.6的推理增强版本,支持深度思考模式,超长上下文理解

国内闭源
262,144

MiMo V2.5 ASR

小米

小米语音识别模型,支持中英双语、中文方言、Code-Switch,在强噪音、多说话人场景下表现优异

国内开源

DeepSeek V4 Pro

DeepSeek

DeepSeek V4旗舰模型,284B总参数13B激活参数,支持思考模式,专为复杂推理和Agent任务优化

国内闭源
1,048,576

DeepSeek V4 Flash

DeepSeek

DeepSeek V4效率优化版,支持思考模式,高性价比适合大规模部署

国内闭源
1,048,576

DeepSeek V3.1 Terminus

DeepSeek

DeepSeek V3.1优化版,修复语言一致性和Agent能力问题

国内闭源
163,840

DeepSeek Coder V3

DeepSeek

DeepSeek最新代码模型,专为代码生成和理解优化

国内闭源

ERNIE 5.0 Thinking Latest

百度

ERNIE 5.0思考模式最新版本,支持深度思考和复杂推理

国内闭源
131,072

ERNIE X1.1

百度

文心大模型X1.1,深度推理模型,在问答、工具调用、智能体、逻辑推理、数学、代码任务效果显著提升

国内闭源
65,536

ERNIE 4.5 Turbo Latest

百度

ERNIE 4.5 Turbo最新版本,高性价比对话模型

国内闭源
131,072

Qwen Max

阿里巴巴

通义千问旗舰模型,强大的多模态理解能力

国内闭源
32,768

Qwen Max Latest

阿里巴巴

通义千问最新快照版本,始终等同最新版本

国内闭源
32,768

Qwen Omni

阿里巴巴

全模态模型,支持文本、图像、音频、视频

国内闭源
32,768

Qwen Omni Realtime

阿里巴巴

实时多模态模型,支持流式交互

国内闭源
32,768

Qwen Coder Latest

阿里巴巴

代码专用最新版本,支持多种编程语言

国内闭源
131,072

Qwen ASR Realtime

阿里巴巴

千问实时语音识别模型,适用于实时会议记录、直播字幕等场景

国内闭源

LongCat-Flash-Chat

美团

MoE架构通用大语言模型,560B总参数,27B激活参数

国内开源
1,048,576

LongCat-Flash-Thinking

美团

深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

国内开源
1,048,576

LongCat-Flash-Omni

美团

全模态实时交互模型,支持文本、图像、音频输入

国内开源
1,048,576

Ling-1T

蚂蚁集团

MoE架构通用大语言模型,万亿参数规模

国内开源
32,768

Ling-Turbo

蚂蚁集团

轻量级通用模型,高效推理

国内开源
32,768

Ring-1T

蚂蚁集团

万亿参数思维模型,开源SOTA推理能力

国内开源
32,768

Ring-mini

蚂蚁集团

轻量级推理模型,适配复杂长序列解码场景

国内开源
32,768

Ming-Omni

蚂蚁集团

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

国内开源
32,768

商量 SenseChat

商汤科技

千亿参数多模态AI对话平台,支持20万字符超长文本理解

国内闭源
200,000

SenseNova-5

商汤科技

商汤日日新大模型,自然语言处理、图片生成、自动化数据标注

国内闭源
32,768

日日新大医

商汤科技

医疗健康助手,基于200亿医学token训练,覆盖13个医疗场景

国内闭源
32,768

InternLM-2.5

上海人工智能实验室

书生语言大模型,开源通用对话模型

国内开源
32,768

InternLM-XComposer

上海人工智能实验室

图文多模态模型,支持图文理解和生成

国内开源
8,192

子曰大模型

网易

教育场景大模型,支持翻译、OCR、语音、作文批改

国内闭源
8,192

GLM-5V-Turbo

智谱AI

智谱AI GLM-5V-Turbo 多模态 Coding 模型

国内闭源
200,000

GLM-4.6V

智谱AI

智谱AI GLM-4.6V 视觉推理模型

国内闭源
128,000

Emu3

BAAI

原生多模态世界模型,文本、图像、视频统一生成

国内开源
8,192

BGE-Large

BAAI

通用向量模型,Hugging Face月度下载第一的国产模型

国内开源
512

Aquila-2

BAAI

悟道语言大模型,中文能力超过GPT-4的90%

国内开源
32,768

Tele-FLM-52B

BAAI

万亿参数稠密模型,训练成本降低一个数量级

国内开源
32,768

Hunyuan Pro

腾讯

腾讯混元旗舰级多模态模型

国内闭源
256,000

Hunyuan 3D

腾讯

腾讯混元3D资产生成模型

国内闭源

Embedding-3

智谱AI

智谱AI Embedding-3 向量模型

国内闭源
8,192

MiniMax M2.7-highspeed

MiniMax

MiniMax M2.7高吞吐版本

国内闭源

GLM-5-Turbo

智谱AI

智谱AI高效能GLM-5模型

国内闭源

GLM-4-Plus

智谱AI

智谱AI多模态旗舰模型

国内闭源
128,000

GLM-4-Flash

智谱AI

智谱AI免费极速模型

国内闭源
128,000

AutoGLM

智谱AI

智谱AI Agent智能体模型

国内闭源

GLM-Z1

智谱AI

智谱AI推理增强模型

国内闭源

Doubao 2.0 Pro

字节跳动

字节跳动豆包大模型2.0旗舰版

国内闭源
3,000,000

Doubao 2.0 Lite

字节跳动

字节跳动豆包大模型2.0轻量版

国内闭源
1,000,000

Doubao 2.0 Mini

字节跳动

字节跳动豆包大模型2.0极速版

国内闭源
128,000

Pangu NLP 718B

华为

华为盘古NLP大模型718B

国内闭源

Pangu CV 30B

华为

华为盘古CV视觉大模型

国内闭源

Pangu Multimodal

华为

华为盘古多模态大模型

国内闭源

Pangu Prediction

华为

华为盘古预测大模型

国内闭源

Pangu Science

华为

华为盘古科学计算大模型

国内闭源

Moonshot V1 8K Vision

月之暗面

月之暗面 Moonshot V1 8K Vision 视觉模型

国内闭源
8,192

Pangu Pro MoE 72B

华为

华为盘古Pro MoE 72B开源模型

国内开源

Moonshot V1 32K Vision

月之暗面

月之暗面 Moonshot V1 32K Vision 视觉模型

国内闭源
32,768

Spark LLM

科大讯飞

科大讯飞星火认知智能大模型

国内闭源

Moonshot V1 128K Vision

月之暗面

月之暗面 Moonshot V1 128K Vision 视觉模型

国内闭源
131,072

Spark ASR Pro

科大讯飞

科大讯飞星火语音识别大模型

国内闭源

Yi-Coder

零一万物

零一万物代码生成模型

国内闭源

Tiangong LLM

昆仑万维

昆仑万维天工大模型

国内闭源

Step 1.5V

阶跃星辰

阶跃星辰多模态模型

国内闭源

Step 1X

阶跃星辰

阶跃星辰图像生成模型

国内闭源

Baichuan 4

百川智能

百川智能旗舰模型

国内闭源

Baichuan4-Finance

百川智能

百川智能金融大模型

国内闭源

Qwen2.5 VL

阿里巴巴

通义千问 Qwen2.5 VL 多模态模型

国内部分开源
32,768

Qwen-VL-Max

阿里巴巴

通义千问视觉理解最强模型

国内闭源
32,768

Qwen3 Omni Flash

阿里巴巴

通义千问 Qwen3 Omni Flash 全模态模型

国内闭源
32,768

Qwen Embed

阿里巴巴

通义千问向量嵌入模型

国内闭源
8,192

MiMo V2 Omni

小米

小米 MiMo V2 Omni 多模态模型

国内闭源
262,144

MiMo V2.5

小米

小米 MiMo V2.5 多模态模型

国内闭源

Yi-Vision

零一万物

零一万物 Yi-Vision 多模态模型

国内闭源
16,384

Baichuan-M3

百川智能

百川 M3 多模态模型

国内闭源
32,768

Step 1o Turbo Vision

阶跃星辰

阶跃 Step 1o Turbo Vision 多模态模型

国内闭源
1,048,576

Pangu-MM-万物理解

华为

盘古多模态 万物理解模型

国内闭源

Pangu-MM-图生文

华为

盘古多模态 图生文模型

国内闭源

Pangu-Weather-Global

华为

盘古天气 全球气象预测模型

国内闭源

Pangu-Ocean-Global

华为

盘古海洋 全球海洋预测模型

国内闭源

Pangu-CV-图像分类

华为

盘古CV 图像分类模型

国内闭源

Pangu-CV-目标检测

华为

盘古CV 目标检测模型

国内闭源

Tencent HY Vision 1.5

腾讯

腾讯混元 Vision 1.5 多模态模型

国内闭源

Hunyuan-turbos-vision

腾讯

腾讯混元 TurboS Vision 多模态模型

国内闭源

Hunyuan-t1-vision

腾讯

腾讯混元 T1 Vision 多模态模型

国内闭源

Hunyuan-vision-video

腾讯

腾讯混元视频理解模型

国内闭源

Hunyuan-translation

腾讯

腾讯混元翻译模型

国内闭源

Hunyuan-translation-lite

腾讯

腾讯混元翻译轻量模型

国内闭源

Sarvam-2B

Sarvam AI

Sarvam AI印度语言模型

国内开源
8,192

Hunyuan-embedding

腾讯

腾讯混元嵌入模型

国内闭源

ERNIE-4.5-Turbo-VL

百度

百度文心 4.5 Turbo VL 多模态模型

国内闭源

Qianfan-VL-70B

百度

千帆 VL-70B 多模态模型

国内闭源

Qianfan-VL-8B

百度

千帆 VL-8B 多模态模型

国内闭源

Ziyue Translate

网易

网易有道子曰翻译模型

国内闭源

Embedding-V1

百度

百度文心 Embedding 嵌入模型

国内闭源

Sarvam-2B-Chat

Sarvam AI

Sarvam AI对话模型

国内开源
8,192

Skywork-4o

昆仑万维

昆仑天工 4o 多模态模型

国内闭源

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型

国内开源