导航菜单
切换主题

LongCat-Flash-Omni

开源

全模态实时交互模型,支持文本、图像、音频输入

LongCat-Flash-Omni是美团的全模态实时交互模型,支持文本、图像、音频输入,实现低延迟的实时音视频交互能力,为多模态应用场景提供高效技术选择。

使用方法

1
2
3
4

核心参数

上下文窗口
1,048,576
最大输出
32,768
输入模态
text+image+audio
开源状态
开源

规格信息

架构类型
MoE
参数量
560B

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

全模态支持

文本、图像、音频统一处理

实时交互

低延迟音视频交互

高效架构

基于LongCat-Flash系列优化

常见问题

LongCat-Flash-Omni是什么?
LongCat-Flash-Omni是美团的全模态实时交互模型,支持文本、图像、音频输入,实现低延迟的实时音视频交互能力,为多模态应用场景提供高效技术选择。
LongCat-Flash-Omni的核心参数是什么?
LongCat-Flash-Omni是美团推出的模型,上下文窗口1,048,576tokens,最大输出32,768tokens,开源模型。
LongCat-Flash-Omni的API价格是多少?
LongCat-Flash-Omni的API调用价格约为¥3600.00/Mtoken(输入)。具体价格请以官方为准。
LongCat-Flash-Omni有哪些主要功能?
全模态支持、实时交互、高效架构
最后更新:2026/5/15数据来源:即客AI模型库