导航菜单
切换主题

文本多模态

201 个模型

HY 3.0 Preview

腾讯·2026-05

腾讯混元3.0预览版,腾讯最新一代大语言模型,提供更强大的理解和生成能力。

国内闭源
256,000

Gemini 3.1 Pro Preview

Google

Google 最先进的 Gemini 3.1 Pro 预览版,具备最新性能、智能和易用性改进

国外闭源
1,048,576

Gemini 3 Flash Preview

Google

Google 最智能的高速模型,结合前沿智能与卓越搜索和接地能力

国外闭源
1,048,576

GPT-5.5

OpenAI

OpenAI 最先进的 GPT-5.5 旗舰模型

国外闭源
400,000

GPT-5.5 Pro

OpenAI

GPT-5 系列专业版模型,针对复杂任务优化

国外闭源
400,000

GPT-5.4 Pro

OpenAI

GPT-5.4 专业版模型

国外闭源
400,000

Claude Opus 4.7

Anthropic

Anthropic 最强大的 Claude Opus 4.7 模型

国外闭源
1,000,000

Claude Opus 4.6

Anthropic

Claude Opus 4.6 模型

国外闭源
1,000,000

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 模型,平衡性能与成本

国外闭源
1,000,000

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5 模型,快速响应与低成本

国外闭源
200,000

ERNIE 5.1

百度

文心系列最新模型,基础能力全面升级,在智能体、知识、推理、深度搜索等方面均有显著提升

国内闭源
131,072

Kimi K2.5

月之暗面

月之暗面最新的 Kimi K2.5 模型

国内闭源
262,144

Kimi K2.6

月之暗面

月之暗面 Kimi K2.6 最新旗舰模型

国内部分开源
256,000

Llama 4

Meta

Meta最新旗舰Llama 4模型

国外开源
256,000

Llama 3.2 90B Vision

Meta·2024-09

Llama 3.2 90B Vision 是 Meta 最大的多模态模型,支持图像推理任务,如文档理解、图像描述和视觉定位。

国外开源
128,000

Llama 3.2 11B Vision

Meta·2024-09

Llama 3.2 11B Vision 是中等规模的多模态模型,在图像推理任务上表现优秀,适合需要视觉能力的应用场景。

国外开源
128,000

Gemini 2.5 Pro

Google

Google 最先进的多模态模型,支持超长上下文和复杂推理任务

国外闭源
1,048,576

Gemini 2.5 Flash

Google

高性能低成本的多模态模型,适合大规模部署

国外闭源
1,048,576

Reka Edge

Reka AI

Reka AI边缘模型

国外闭源
64,000

MiniCPM-2.4B

OpenBMB

OpenBMB小型CPM模型

国外开源
4,096

Granite 3.3 MoE

IBM

IBM Granite MoE模型

国外开源
128,000

Voyage-2

Voyage

Voyage基础嵌入模型

国外闭源
16,000

Gemini 3.1 Flash-Lite Preview

Google

Google 最具成本效益的模型,针对大批量代理任务、翻译和简单数据处理优化

国外闭源
1,048,576

Jina ColBERT v2

Jina

Jina ColBERT检索模型

国外开源
8,192

Gemini 3.1 Flash Live Preview

Google

Google 低延迟音频到音频模型,针对实时对话优化

国外闭源
1,048,576

ERNIE-4.5-VL-424B-A47B

百度

ERNIE 4.5 VL 开源多模态模型

国内开源

ERNIE-4.5-VL-28B-A3B-Thinking

百度

ERNIE 4.5 VL 轻量多模态思考模型

国内开源

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 系列中最轻量的模型,针对简单任务优化

国外闭源
1,048,576

Gemini 2.5 Flash Native Audio

Google

Gemini 2.5 Flash 的原生音频版本

国外闭源
1,048,576

Gemini 2.0 Flash

Google

Google Gemini 2.0 系列高速模型

国外闭源
1,048,576

Gemini 2.0 Flash-Lite

Google

Google Gemini 2.0 系列最轻量模型

国外闭源
1,048,576

Amazon Nova Lite

AWS

Amazon Nova Lite 多模态模型

国外闭源
300,000

Amazon Nova Pro

AWS

Amazon Nova Pro 多模态模型

国外闭源
300,000

Amazon Nova Premier

AWS

Amazon Nova Premier 最强多模态模型

国外闭源
1,000,000

Gemini Embedding

Google

Google 文本嵌入模型

国外闭源
2,048

Gemini Robotics-ER 1.6 Preview

Google

Google 机器人控制模型

国外闭源

Doubao-Seed-2.0

字节跳动

豆包 Seed 2.0 旗舰级 Agent 通用模型

国内闭源

Doubao-Vision

字节跳动

豆包视觉理解模型

国内闭源

GPT-5.4

OpenAI

OpenAI GPT-5.4 高性能模型

国外闭源
400,000

GPT-5.4 Mini

OpenAI

GPT-5 系列轻量级模型,针对成本效益优化

国外闭源
200,000

GPT Realtime 1.5

OpenAI

OpenAI 实时多模态模型,支持低延迟音频交互

国外闭源

GPT Realtime Mini

OpenAI

轻量级实时多模态模型

国外闭源

Doubao-3D-Generation

字节跳动

豆包3D生成模型

国内闭源

Qwen-Audio

阿里巴巴

通义千问音频理解模型

国内开源

Qwen-Audio-Chat

阿里巴巴

通义千问音频对话模型

国内开源

Qwen-VL-Plus

阿里巴巴

通义千问视觉理解增强版

国内闭源
32,768

GPT-4o Transcribe

OpenAI

OpenAI 高质量语音转录模型

国外闭源

GPT-4o Mini Transcribe

OpenAI

轻量级语音转录模型

国外闭源

Amazon Titan Text Embeddings V2

AWS

Amazon Titan 文本嵌入 V2 模型

国外闭源
8,192

Amazon Titan Multimodal Embeddings

AWS

Amazon Titan 多模态嵌入模型

国外闭源

Kimi K2.5 Thinking

月之暗面

Kimi K2.5的推理增强版本,支持深度思考模式,具备更强的逻辑推理和数学能力

国内闭源
262,144

Kimi K2.6 Thinking

月之暗面

Kimi K2.6的推理增强版本,支持深度思考模式,超长上下文理解

国内闭源
262,144

Claude Opus 4.5

Anthropic

Claude Opus 4.5 模型

国外闭源
200,000

MiMo V2.5 ASR

小米

小米语音识别模型,支持中英双语、中文方言、Code-Switch,在强噪音、多说话人场景下表现优异

国内开源

Claude Opus 4.1

Anthropic

Claude Opus 4.1 模型

国外闭源
200,000

DeepSeek V4 Pro

DeepSeek

DeepSeek V4旗舰模型,284B总参数13B激活参数,支持思考模式,专为复杂推理和Agent任务优化

国内闭源
1,048,576

DeepSeek V4 Flash

DeepSeek

DeepSeek V4效率优化版,支持思考模式,高性价比适合大规模部署

国内闭源
1,048,576

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5 模型

国外闭源
200,000

DeepSeek V3.1 Terminus

DeepSeek

DeepSeek V3.1优化版,修复语言一致性和Agent能力问题

国内闭源
163,840

DeepSeek Coder V3

DeepSeek

DeepSeek最新代码模型,专为代码生成和理解优化

国内闭源

Claude Haiku 3.5

Anthropic

Claude Haiku 3.5 模型

国外闭源
200,000

Claude Haiku 3

Anthropic

Claude Haiku 3 模型

国外闭源
200,000

ERNIE 5.0 Thinking Latest

百度

ERNIE 5.0思考模式最新版本,支持深度思考和复杂推理

国内闭源
131,072

ERNIE X1.1

百度

文心大模型X1.1,深度推理模型,在问答、工具调用、智能体、逻辑推理、数学、代码任务效果显著提升

国内闭源
65,536

ERNIE 4.5 Turbo Latest

百度

ERNIE 4.5 Turbo最新版本,高性价比对话模型

国内闭源
131,072

Qwen Max

阿里巴巴

通义千问旗舰模型,强大的多模态理解能力

国内闭源
32,768

Qwen Max Latest

阿里巴巴

通义千问最新快照版本,始终等同最新版本

国内闭源
32,768

Qwen Omni

阿里巴巴

全模态模型,支持文本、图像、音频、视频

国内闭源
32,768

Qwen Omni Realtime

阿里巴巴

实时多模态模型,支持流式交互

国内闭源
32,768

Qwen Coder Latest

阿里巴巴

代码专用最新版本,支持多种编程语言

国内闭源
131,072

Qwen ASR Realtime

阿里巴巴

千问实时语音识别模型,适用于实时会议记录、直播字幕等场景

国内闭源

LongCat-Flash-Chat

美团

MoE架构通用大语言模型,560B总参数,27B激活参数

国内开源
1,048,576

LongCat-Flash-Thinking

美团

深度推理模型,首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

国内开源
1,048,576

LongCat-Flash-Omni

美团

全模态实时交互模型,支持文本、图像、音频输入

国内开源
1,048,576

Ling-1T

蚂蚁集团

MoE架构通用大语言模型,万亿参数规模

国内开源
32,768

Ling-Turbo

蚂蚁集团

轻量级通用模型,高效推理

国内开源
32,768

Ring-1T

蚂蚁集团

万亿参数思维模型,开源SOTA推理能力

国内开源
32,768

Ring-mini

蚂蚁集团

轻量级推理模型,适配复杂长序列解码场景

国内开源
32,768

Ming-Omni

蚂蚁集团

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

国内开源
32,768

商量 SenseChat

商汤科技

千亿参数多模态AI对话平台,支持20万字符超长文本理解

国内闭源
200,000

SenseNova-5

商汤科技

商汤日日新大模型,自然语言处理、图片生成、自动化数据标注

国内闭源
32,768

日日新大医

商汤科技

医疗健康助手,基于200亿医学token训练,覆盖13个医疗场景

国内闭源
32,768

InternLM-2.5

上海人工智能实验室

书生语言大模型,开源通用对话模型

国内开源
32,768

InternLM-XComposer

上海人工智能实验室

图文多模态模型,支持图文理解和生成

国内开源
8,192

子曰大模型

网易

教育场景大模型,支持翻译、OCR、语音、作文批改

国内闭源
8,192

Embed v4

Cohere

Cohere Embed v4 多语言嵌入模型

国外闭源

Rerank v3

Cohere

Cohere Rerank v3 重排序模型

国外闭源

GLM-5V-Turbo

智谱AI

智谱AI GLM-5V-Turbo 多模态 Coding 模型

国内闭源
200,000

GLM-4.6V

智谱AI

智谱AI GLM-4.6V 视觉推理模型

国内闭源
128,000

Emu3

BAAI

原生多模态世界模型,文本、图像、视频统一生成

国内开源
8,192

BGE-Large

BAAI

通用向量模型,Hugging Face月度下载第一的国产模型

国内开源
512

Aquila-2

BAAI

悟道语言大模型,中文能力超过GPT-4的90%

国内开源
32,768

Tele-FLM-52B

BAAI

万亿参数稠密模型,训练成本降低一个数量级

国内开源
32,768

Hunyuan Pro

腾讯

腾讯混元旗舰级多模态模型

国内闭源
256,000

Hunyuan 3D

腾讯

腾讯混元3D资产生成模型

国内闭源

Embedding-3

智谱AI

智谱AI Embedding-3 向量模型

国内闭源
8,192

MiniMax M2.7-highspeed

MiniMax

MiniMax M2.7高吞吐版本

国内闭源

GLM-5-Turbo

智谱AI

智谱AI高效能GLM-5模型

国内闭源

GLM-4-Plus

智谱AI

智谱AI多模态旗舰模型

国内闭源
128,000

GLM-4-Flash

智谱AI

智谱AI免费极速模型

国内闭源
128,000

AutoGLM

智谱AI

智谱AI Agent智能体模型

国内闭源

GLM-Z1

智谱AI

智谱AI推理增强模型

国内闭源

Doubao 2.0 Pro

字节跳动

字节跳动豆包大模型2.0旗舰版

国内闭源
3,000,000

Doubao 2.0 Lite

字节跳动

字节跳动豆包大模型2.0轻量版

国内闭源
1,000,000

Doubao 2.0 Mini

字节跳动

字节跳动豆包大模型2.0极速版

国内闭源
128,000

Pangu NLP 718B

华为

华为盘古NLP大模型718B

国内闭源

Pangu CV 30B

华为

华为盘古CV视觉大模型

国内闭源

Pangu Multimodal

华为

华为盘古多模态大模型

国内闭源

Pangu Prediction

华为

华为盘古预测大模型

国内闭源

Pangu Science

华为

华为盘古科学计算大模型

国内闭源

Moonshot V1 8K Vision

月之暗面

月之暗面 Moonshot V1 8K Vision 视觉模型

国内闭源
8,192

Pangu Pro MoE 72B

华为

华为盘古Pro MoE 72B开源模型

国内开源

Moonshot V1 32K Vision

月之暗面

月之暗面 Moonshot V1 32K Vision 视觉模型

国内闭源
32,768

Spark LLM

科大讯飞

科大讯飞星火认知智能大模型

国内闭源

Moonshot V1 128K Vision

月之暗面

月之暗面 Moonshot V1 128K Vision 视觉模型

国内闭源
131,072

Spark ASR Pro

科大讯飞

科大讯飞星火语音识别大模型

国内闭源

Yi-Coder

零一万物

零一万物代码生成模型

国内闭源

Tiangong LLM

昆仑万维

昆仑万维天工大模型

国内闭源

Step 1.5V

阶跃星辰

阶跃星辰多模态模型

国内闭源

Step 1X

阶跃星辰

阶跃星辰图像生成模型

国内闭源

Baichuan 4

百川智能

百川智能旗舰模型

国内闭源

Baichuan4-Finance

百川智能

百川智能金融大模型

国内闭源

GPT-5

OpenAI

OpenAI最新旗舰模型

国外闭源
256,000

Qwen2.5 VL

阿里巴巴

通义千问 Qwen2.5 VL 多模态模型

国内部分开源
32,768

GPT-4.1

OpenAI

OpenAI增强版GPT-4模型

国外闭源
1,000,000

Qwen-VL-Max

阿里巴巴

通义千问视觉理解最强模型

国内闭源
32,768

GPT-4.1 Mini

OpenAI

OpenAI轻量版GPT-4.1模型

国外闭源
1,000,000

Qwen3 Omni Flash

阿里巴巴

通义千问 Qwen3 Omni Flash 全模态模型

国内闭源
32,768

GPT-4.1 Nano

OpenAI

OpenAI超轻量GPT-4.1模型

国外闭源
1,000,000

Claude Opus 4

Anthropic

Anthropic旗舰Opus 4模型

国外闭源
200,000

Claude Sonnet 4

Anthropic

Anthropic平衡版Sonnet 4模型

国外闭源
200,000

Claude Haiku 4

Anthropic

Anthropic轻量版Haiku 4模型

国外闭源
200,000

Claude Sonnet 4.4

Anthropic

Anthropic增强版Sonnet 4.4模型

国外闭源
200,000

Qwen Embed

阿里巴巴

通义千问向量嵌入模型

国内闭源
8,192

MiMo V2 Omni

小米

小米 MiMo V2 Omni 多模态模型

国内闭源
262,144

Llama 3.3 8B

Meta

Meta小规模Llama 3.3模型

国外开源
128,000

MiMo V2.5

小米

小米 MiMo V2.5 多模态模型

国内闭源

Llama Guard 3

Meta

Meta安全防护模型

国外开源
128,000

Mistral Large 3.1

Mistral AI

Mistral AI最新旗舰模型

国外闭源
128,000

Mistral Small 3.1

Mistral AI

Mistral AI轻量版模型

国外闭源
128,000

Grok 4.1

xAI

xAI最新Grok 4.1模型

国外闭源
128,000

Grok 4 Vision

xAI

xAI多模态Grok 4模型

国外闭源
128,000

Nemotron-4-340B-Reward

NVIDIA

NVIDIA奖励模型

国外开源
4,096

Nemotron-VLM

NVIDIA

NVIDIA视觉语言模型

国外开源
8,192

Phi-4

Microsoft

Microsoft小型高效模型

国外开源
128,000

Yi-Vision

零一万物

零一万物 Yi-Vision 多模态模型

国内闭源
16,384

Phi-4 Mini

Microsoft

Microsoft超小型模型

国外开源
128,000

Phi-3.5-MoE

Microsoft

Microsoft MoE架构模型

国外开源
128,000

Phi-3.5-Vision

Microsoft

Microsoft多模态模型

国外开源
128,000

Phi-3.5-Mini

Microsoft

Microsoft轻量版模型

国外开源
128,000

MAI-1

Microsoft

Microsoft自研大模型

国外闭源

Jamba-1-9B

AI21 Labs

AI21小规模Jamba模型

国外开源
256,000

Jamba-1.5-Vision

AI21 Labs

AI21多模态Jamba模型

国外闭源
256,000

Baichuan-M3

百川智能

百川 M3 多模态模型

国内闭源
32,768

Synthesia AI Avatars

Synthesia

Synthesia AI数字人视频生成

国外闭源

Step 1o Turbo Vision

阶跃星辰

阶跃 Step 1o Turbo Vision 多模态模型

国内闭源
1,048,576

Voyage-3-large

Voyage

Voyage旗舰嵌入模型

国外闭源
32,000

Pangu-MM-万物理解

华为

盘古多模态 万物理解模型

国内闭源

Voyage-3

Voyage

Voyage高效嵌入模型

国外闭源
32,000

Pangu-MM-图生文

华为

盘古多模态 图生文模型

国内闭源

Jina Embeddings v3

Jina

Jina多语言嵌入模型

国外开源
8,192

Pangu-Weather-Global

华为

盘古天气 全球气象预测模型

国内闭源

Jina Reranker v2

Jina

Jina重排序模型

国外开源
8,192

Pangu-Ocean-Global

华为

盘古海洋 全球海洋预测模型

国内闭源

Sonic

Cartesia

Cartesia实时语音合成模型

国外闭源

Pangu-CV-图像分类

华为

盘古CV 图像分类模型

国内闭源

Aura-2

Deepgram

Deepgram最新语音识别模型

国外闭源

Pangu-CV-目标检测

华为

盘古CV 目标检测模型

国内闭源

Reka Core

Reka AI

Reka AI多模态旗舰模型

国外闭源
128,000

Reka Flash

Reka AI

Reka AI快速多模态模型

国外闭源
128,000

Granite 3.3

IBM

IBM企业级大模型

国外开源
128,000

Granite Code

IBM

IBM代码生成模型

国外开源
128,000

Tencent HY Vision 1.5

腾讯

腾讯混元 Vision 1.5 多模态模型

国内闭源

Hunyuan-turbos-vision

腾讯

腾讯混元 TurboS Vision 多模态模型

国内闭源

h2oGPT

H2O.ai

H2O.ai开源企业模型

国外开源
4,096

Hunyuan-t1-vision

腾讯

腾讯混元 T1 Vision 多模态模型

国内闭源

HuggingChat

Hugging Face

Hugging Face对话模型服务

国外闭源

Hunyuan-vision-video

腾讯

腾讯混元视频理解模型

国内闭源

Hunyuan-translation

腾讯

腾讯混元翻译模型

国内闭源

MiniCPM

OpenBMB

OpenBMB小型高效模型

国外开源

Hunyuan-translation-lite

腾讯

腾讯混元翻译轻量模型

国内闭源

Sarvam-2B

Sarvam AI

Sarvam AI印度语言模型

国内开源
8,192

Hunyuan-embedding

腾讯

腾讯混元嵌入模型

国内闭源

Falcon 3

TII

TII Falcon系列最新模型

国外开源
128,000

SWE-agent

Princeton

Princeton软件工程AI代理

国外开源

ERNIE-4.5-Turbo-VL

百度

百度文心 4.5 Turbo VL 多模态模型

国内闭源

Qianfan-VL-70B

百度

千帆 VL-70B 多模态模型

国内闭源

Zephyr 7B

Hugging Face

Hugging Face开源对话模型

国外开源
32,768

Qianfan-VL-8B

百度

千帆 VL-8B 多模态模型

国内闭源

Ziyue Translate

网易

网易有道子曰翻译模型

国内闭源

Embedding-V1

百度

百度文心 Embedding 嵌入模型

国内闭源

LTX-13B

Lightricks

Lightricks 13B视频模型

国外开源

Synthesia Express

Synthesia

Synthesia快速视频生成

国外闭源

Sarvam-2B-Chat

Sarvam AI

Sarvam AI对话模型

国内开源
8,192

Falcon 3 10B

TII

TII Falcon 3 10B模型

国外开源
128,000

h2oVL

H2O.ai

H2O.ai视觉语言模型

国外开源
8,192

OpenPI

Princeton

Princeton具身智能模型

国外开源

Sonic-OS

Cartesia

Cartesia开源语音合成模型

国外开源

Nova-3

Deepgram

Deepgram Nova-3语音识别

国外闭源

Skywork-4o

昆仑万维

昆仑天工 4o 多模态模型

国内闭源

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型

国内开源