文本多模态

HY 3.0 Preview

腾讯·2026-05

腾讯混元3.0预览版，腾讯最新一代大语言模型，提供更强大的理解和生成能力。

256,000

Gemini 3.1 Pro Preview

Google 最先进的 Gemini 3.1 Pro 预览版，具备最新性能、智能和易用性改进

Gemini 3 Flash Preview

Google 最智能的高速模型，结合前沿智能与卓越搜索和接地能力

GPT-5.5

OpenAI 最先进的 GPT-5.5 旗舰模型

400,000

GPT-5.5 Pro

GPT-5 系列专业版模型，针对复杂任务优化

400,000

GPT-5.4 Pro

GPT-5.4 专业版模型

Claude Opus 4.7

Anthropic 最强大的 Claude Opus 4.7 模型

1,000,000

Claude Opus 4.6

Claude Opus 4.6 模型

Claude Sonnet 4.6

Claude Sonnet 4.6 模型，平衡性能与成本

1,000,000

Claude Haiku 4.5

Claude Haiku 4.5 模型，快速响应与低成本

ERNIE 5.1

文心系列最新模型，基础能力全面升级，在智能体、知识、推理、深度搜索等方面均有显著提升

Kimi K2.5

月之暗面最新的 Kimi K2.5 模型

Kimi K2.6

月之暗面 Kimi K2.6 最新旗舰模型

国内部分开源

256,000

Llama 4

Llama 3.2 90B Vision

Meta·2024-09

Llama 3.2 90B Vision 是 Meta 最大的多模态模型，支持图像推理任务，如文档理解、图像描述和视觉定位。

128,000

Llama 3.2 11B Vision

Meta·2024-09

Llama 3.2 11B Vision 是中等规模的多模态模型，在图像推理任务上表现优秀，适合需要视觉能力的应用场景。

128,000

Gemini 2.5 Pro

Google 最先进的多模态模型，支持超长上下文和复杂推理任务

Gemini 2.5 Flash

高性能低成本的多模态模型，适合大规模部署

Reka Edge

Reka AI边缘模型

MiniCPM-2.4B

OpenBMB小型CPM模型

Granite 3.3 MoE

IBM Granite MoE模型

Voyage-2

Voyage基础嵌入模型

Gemini 3.1 Flash-Lite Preview

Google 最具成本效益的模型，针对大批量代理任务、翻译和简单数据处理优化

Jina ColBERT v2

Jina ColBERT检索模型

Gemini 3.1 Flash Live Preview

Google 低延迟音频到音频模型，针对实时对话优化

ERNIE-4.5-VL-424B-A47B

ERNIE 4.5 VL 开源多模态模型

ERNIE-4.5-VL-28B-A3B-Thinking

ERNIE 4.5 VL 轻量多模态思考模型

Gemini 2.5 Flash-Lite

Gemini 2.5 系列中最轻量的模型，针对简单任务优化

Gemini 2.5 Flash Native Audio

Gemini 2.5 Flash 的原生音频版本

Gemini 2.0 Flash

Google Gemini 2.0 系列高速模型

Gemini 2.0 Flash-Lite

Google Gemini 2.0 系列最轻量模型

Amazon Nova Lite

Amazon Nova Lite 多模态模型

300,000

Amazon Nova Pro

Amazon Nova Pro 多模态模型

300,000

Amazon Nova Premier

Amazon Nova Premier 最强多模态模型

1,000,000

Gemini Embedding

Google 文本嵌入模型

Gemini Robotics-ER 1.6 Preview

Google 机器人控制模型

Doubao-Seed-2.0

字节跳动

豆包 Seed 2.0 旗舰级 Agent 通用模型

Doubao-Vision

字节跳动

豆包视觉理解模型

GPT-5.4

OpenAI GPT-5.4 高性能模型

GPT-5.4 Mini

GPT-5 系列轻量级模型，针对成本效益优化

GPT Realtime 1.5

OpenAI 实时多模态模型，支持低延迟音频交互

GPT Realtime Mini

轻量级实时多模态模型

Doubao-3D-Generation

字节跳动

豆包3D生成模型

Qwen-Audio

通义千问音频理解模型

Qwen-Audio-Chat

通义千问音频对话模型

Qwen-VL-Plus

通义千问视觉理解增强版

GPT-4o Transcribe

OpenAI 高质量语音转录模型

GPT-4o Mini Transcribe

轻量级语音转录模型

Amazon Titan Text Embeddings V2

Amazon Titan 文本嵌入 V2 模型

Amazon Titan Multimodal Embeddings

Amazon Titan 多模态嵌入模型

Kimi K2.5 Thinking

Kimi K2.5的推理增强版本，支持深度思考模式，具备更强的逻辑推理和数学能力

262,144

Kimi K2.6 Thinking

Kimi K2.6的推理增强版本，支持深度思考模式，超长上下文理解

262,144

Claude Opus 4.5

Claude Opus 4.5 模型

MiMo V2.5 ASR

小米

小米语音识别模型，支持中英双语、中文方言、Code-Switch，在强噪音、多说话人场景下表现优异

Claude Opus 4.1

Claude Opus 4.1 模型

DeepSeek V4 Pro

DeepSeek V4旗舰模型，284B总参数13B激活参数，支持思考模式，专为复杂推理和Agent任务优化

DeepSeek V4 Flash

DeepSeek V4效率优化版，支持思考模式，高性价比适合大规模部署

Claude Sonnet 4.5

Claude Sonnet 4.5 模型

DeepSeek V3.1 Terminus

DeepSeek V3.1优化版，修复语言一致性和Agent能力问题

163,840

DeepSeek Coder V3

DeepSeek最新代码模型，专为代码生成和理解优化

Claude Haiku 3.5

Claude Haiku 3.5 模型

Claude Haiku 3

Claude Haiku 3 模型

ERNIE 5.0 Thinking Latest

ERNIE 5.0思考模式最新版本，支持深度思考和复杂推理

ERNIE X1.1

文心大模型X1.1，深度推理模型，在问答、工具调用、智能体、逻辑推理、数学、代码任务效果显著提升

65,536

ERNIE 4.5 Turbo Latest

ERNIE 4.5 Turbo最新版本，高性价比对话模型

Qwen Max

通义千问旗舰模型，强大的多模态理解能力

Qwen Max Latest

通义千问最新快照版本，始终等同最新版本

Qwen Omni

全模态模型，支持文本、图像、音频、视频

Qwen Omni Realtime

实时多模态模型，支持流式交互

Qwen Coder Latest

代码专用最新版本，支持多种编程语言

Qwen ASR Realtime

千问实时语音识别模型，适用于实时会议记录、直播字幕等场景

LongCat-Flash-Chat

美团

MoE架构通用大语言模型，560B总参数，27B激活参数

LongCat-Flash-Thinking

美团

深度推理模型，首个同时具备深度思考+工具调用与非形式化+形式化推理能力的国产模型

LongCat-Flash-Omni

美团

全模态实时交互模型，支持文本、图像、音频输入

Ling-1T

MoE架构通用大语言模型，万亿参数规模

Ling-Turbo

轻量级通用模型，高效推理

Ring-1T

万亿参数思维模型，开源SOTA推理能力

Ring-mini

轻量级推理模型，适配复杂长序列解码场景

Ming-Omni

蚂蚁集团

统一多模态架构，支持文本、图像、音频、视频的跨模态理解与生成

商量 SenseChat

商汤科技

千亿参数多模态AI对话平台，支持20万字符超长文本理解

SenseNova-5

商汤科技

商汤日日新大模型，自然语言处理、图片生成、自动化数据标注

日日新大医

商汤科技

医疗健康助手，基于200亿医学token训练，覆盖13个医疗场景

InternLM-2.5

书生语言大模型，开源通用对话模型

InternLM-XComposer

图文多模态模型，支持图文理解和生成

子曰大模型

网易

教育场景大模型，支持翻译、OCR、语音、作文批改

Embed v4

Cohere

Cohere Embed v4 多语言嵌入模型

Rerank v3

Cohere

Cohere Rerank v3 重排序模型

GLM-5V-Turbo

智谱AI GLM-5V-Turbo 多模态 Coding 模型

GLM-4.6V

智谱AI GLM-4.6V 视觉推理模型

Emu3

BAAI

原生多模态世界模型，文本、图像、视频统一生成

BGE-Large

BAAI

通用向量模型，Hugging Face月度下载第一的国产模型

512

Aquila-2

BAAI

悟道语言大模型，中文能力超过GPT-4的90%

Tele-FLM-52B

万亿参数稠密模型，训练成本降低一个数量级

Hunyuan Pro

腾讯混元旗舰级多模态模型

Hunyuan 3D

腾讯混元3D资产生成模型

Embedding-3

智谱AI Embedding-3 向量模型

MiniMax M2.7-highspeed

MiniMax

MiniMax M2.7高吞吐版本

GLM-5-Turbo

智谱AI高效能GLM-5模型

GLM-4-Plus

智谱AI多模态旗舰模型

GLM-4-Flash

智谱AI免费极速模型

AutoGLM

智谱AI Agent智能体模型

GLM-Z1

智谱AI推理增强模型

Doubao 2.0 Pro

字节跳动豆包大模型2.0旗舰版

Doubao 2.0 Lite

字节跳动豆包大模型2.0轻量版

Doubao 2.0 Mini

字节跳动豆包大模型2.0极速版

Pangu NLP 718B

华为盘古NLP大模型718B

Pangu CV 30B

华为盘古CV视觉大模型

Pangu Multimodal

华为盘古多模态大模型

Pangu Prediction

华为盘古预测大模型

Pangu Science

华为盘古科学计算大模型

Moonshot V1 8K Vision

月之暗面 Moonshot V1 8K Vision 视觉模型

Pangu Pro MoE 72B

华为盘古Pro MoE 72B开源模型

Moonshot V1 32K Vision

月之暗面 Moonshot V1 32K Vision 视觉模型

Spark LLM

科大讯飞

科大讯飞星火认知智能大模型

Moonshot V1 128K Vision

月之暗面 Moonshot V1 128K Vision 视觉模型

Spark ASR Pro

科大讯飞

科大讯飞星火语音识别大模型

Yi-Coder

零一万物

零一万物代码生成模型

Tiangong LLM

昆仑万维

昆仑万维天工大模型

Step 1.5V

阶跃星辰

阶跃星辰多模态模型

Step 1X

阶跃星辰

阶跃星辰图像生成模型

Baichuan 4

百川智能

百川智能旗舰模型

Baichuan4-Finance

百川智能

百川智能金融大模型

GPT-5

OpenAI最新旗舰模型

Qwen2.5 VL

通义千问 Qwen2.5 VL 多模态模型

国内部分开源

GPT-4.1

OpenAI增强版GPT-4模型

Qwen-VL-Max

通义千问视觉理解最强模型

GPT-4.1 Mini

OpenAI轻量版GPT-4.1模型

Qwen3 Omni Flash

通义千问 Qwen3 Omni Flash 全模态模型

GPT-4.1 Nano

OpenAI超轻量GPT-4.1模型

Claude Opus 4

Anthropic旗舰Opus 4模型

Claude Sonnet 4

Anthropic平衡版Sonnet 4模型

Claude Haiku 4

Anthropic轻量版Haiku 4模型

Claude Sonnet 4.4

Anthropic增强版Sonnet 4.4模型

Qwen Embed

通义千问向量嵌入模型

MiMo V2 Omni

小米

小米 MiMo V2 Omni 多模态模型

262,144

Llama 3.3 8B

MiMo V2.5

小米

小米 MiMo V2.5 多模态模型

Llama Guard 3

Mistral Large 3.1

Mistral AI最新旗舰模型

Mistral Small 3.1

Mistral AI轻量版模型

Grok 4.1

xAI最新Grok 4.1模型

Grok 4 Vision

xAI多模态Grok 4模型

Nemotron-4-340B-Reward

NVIDIA奖励模型

Nemotron-VLM

NVIDIA视觉语言模型

Phi-4

Microsoft小型高效模型

Yi-Vision

零一万物 Yi-Vision 多模态模型

Phi-4 Mini

Microsoft超小型模型

Phi-3.5-MoE

Microsoft MoE架构模型

Phi-3.5-Vision

Microsoft多模态模型

Phi-3.5-Mini

Microsoft轻量版模型

MAI-1

Microsoft

Microsoft自研大模型

Jamba-1-9B

AI21小规模Jamba模型

Jamba-1.5-Vision

AI21多模态Jamba模型

Baichuan-M3

百川 M3 多模态模型

Synthesia AI Avatars

Synthesia

Synthesia AI数字人视频生成

Step 1o Turbo Vision

阶跃星辰

阶跃 Step 1o Turbo Vision 多模态模型

Voyage-3-large

Voyage旗舰嵌入模型

Pangu-MM-万物理解

盘古多模态万物理解模型

Voyage-3

Voyage高效嵌入模型

Pangu-MM-图生文

盘古多模态图生文模型

Jina Embeddings v3

Jina多语言嵌入模型

Pangu-Weather-Global

盘古天气全球气象预测模型

Jina Reranker v2

Jina重排序模型

Pangu-Ocean-Global

盘古海洋全球海洋预测模型

Sonic

Cartesia

Cartesia实时语音合成模型

Pangu-CV-图像分类

盘古CV 图像分类模型

Aura-2

Deepgram

Deepgram最新语音识别模型

Pangu-CV-目标检测

盘古CV 目标检测模型

Reka Core

Reka AI多模态旗舰模型

Reka Flash

Reka AI快速多模态模型

Granite 3.3

IBM企业级大模型

Granite Code

IBM代码生成模型

Tencent HY Vision 1.5

腾讯混元 Vision 1.5 多模态模型

Hunyuan-turbos-vision

腾讯混元 TurboS Vision 多模态模型

h2oGPT

H2O.ai开源企业模型

Hunyuan-t1-vision

腾讯混元 T1 Vision 多模态模型

HuggingChat

Hugging Face

Hugging Face对话模型服务

Hunyuan-vision-video

腾讯混元视频理解模型

Hunyuan-translation

腾讯混元翻译模型

MiniCPM

OpenBMB

OpenBMB小型高效模型

Hunyuan-translation-lite

腾讯混元翻译轻量模型

Sarvam-2B

Sarvam AI印度语言模型

Hunyuan-embedding

腾讯混元嵌入模型

Falcon 3

TII Falcon系列最新模型

SWE-agent

Princeton

Princeton软件工程AI代理

ERNIE-4.5-Turbo-VL

百度文心 4.5 Turbo VL 多模态模型

Qianfan-VL-70B

千帆 VL-70B 多模态模型

Zephyr 7B

Hugging Face开源对话模型

Qianfan-VL-8B

千帆 VL-8B 多模态模型

Ziyue Translate

网易

网易有道子曰翻译模型

Embedding-V1

百度文心 Embedding 嵌入模型

LTX-13B

Lightricks

Lightricks 13B视频模型

Synthesia Express

Synthesia

Synthesia快速视频生成

Sarvam-2B-Chat

Sarvam AI对话模型

Falcon 3 10B

TII Falcon 3 10B模型

h2oVL

H2O.ai视觉语言模型

OpenPI

Princeton

Princeton具身智能模型

Sonic-OS

Cartesia

Cartesia开源语音合成模型

Nova-3

Deepgram

Deepgram Nova-3语音识别

Skywork-4o

昆仑万维

昆仑天工 4o 多模态模型

Skywork-R1V

昆仑万维

昆仑天工 R1V 多模态推理模型