◈
Ming-Omni是蚂蚁集团的统一多模态模型,支持文本、图像、音频、视频的跨模态理解与生成。
使用方法
1
2
3
核心参数
上下文窗口
32,768
最大输出
8,192
输入模态
text+image+audio+video
开源状态
开源
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
全模态
文本、图像、音频、视频
跨模态
理解与生成统一
开放兼容
OpenAI/Anthropic兼容
常见问题
Ming-Omni是什么?▼
Ming-Omni是蚂蚁集团的统一多模态模型,支持文本、图像、音频、视频的跨模态理解与生成。
Ming-Omni的核心参数是什么?▼
Ming-Omni是蚂蚁集团推出的模型,上下文窗口32,768tokens,最大输出8,192tokens,开源模型。
Ming-Omni的API价格是多少?▼
Ming-Omni的API调用价格约为¥2000.00/Mtoken(输入)。具体价格请以官方为准。
Ming-Omni有哪些主要功能?▼
全模态、跨模态、开放兼容
最后更新:2026/5/15数据来源:即客AI模型库