导航菜单
切换主题

Ming-Omni

开源

统一多模态架构,支持文本、图像、音频、视频的跨模态理解与生成

Ming-Omni是蚂蚁集团的统一多模态模型,支持文本、图像、音频、视频的跨模态理解与生成。

使用方法

1
2
3

核心参数

上下文窗口
32,768
最大输出
8,192
输入模态
text+image+audio+video
开源状态
开源

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

全模态

文本、图像、音频、视频

跨模态

理解与生成统一

开放兼容

OpenAI/Anthropic兼容

常见问题

Ming-Omni是什么?
Ming-Omni是蚂蚁集团的统一多模态模型,支持文本、图像、音频、视频的跨模态理解与生成。
Ming-Omni的核心参数是什么?
Ming-Omni是蚂蚁集团推出的模型,上下文窗口32,768tokens,最大输出8,192tokens,开源模型。
Ming-Omni的API价格是多少?
Ming-Omni的API调用价格约为¥2000.00/Mtoken(输入)。具体价格请以官方为准。
Ming-Omni有哪些主要功能?
全模态、跨模态、开放兼容
最后更新:2026/5/15数据来源:即客AI模型库