Qwen2.5 VL 是通义千问多模态模型,支持图像理解和视频理解。
核心参数
上下文窗口
32,768
输入模态
文本
开源状态
部分开源
API 定价
国内定价(单位:元/Mtoken)
StandardMtoken
输入
¥0.8
输出
¥2
功能特性
多模态
图像和视频理解
OCR 能力
强大的文字识别
图表理解
图表数据分析
适用场景
开发者
视觉理解应用
企业
文档智能处理
同厂商系列对比
| 系列 | 代表模型 | 上下文 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| 通义千问 VL | Qwen2.5 VL | 32,768 | ¥0.8/Mtoken | ¥2/Mtoken |
| 通义千问 Audio | Qwen-Audio | - | - | - |
常见问题
Qwen2.5 VL是什么?▼
Qwen2.5 VL 是通义千问多模态模型,支持图像理解和视频理解。
Qwen2.5 VL的核心参数是什么?▼
Qwen2.5 VL是阿里巴巴推出的模型,上下文窗口32,768tokens。
Qwen2.5 VL的API价格是多少?▼
Qwen2.5 VL的API调用价格约为¥800.00/Mtoken(输入)。具体价格请以官方为准。
Qwen2.5 VL有哪些主要功能?▼
多模态、OCR 能力、图表理解
最后更新:2026/5/6数据来源:即客AI模型库
