🎵 音频模型
共 6 个模型
其他模型(6)
◈
MiMo V2.5 ASR
小米
小米语音识别模型,支持中英双语、中文方言、Code-Switch,在强噪音、多说话人场景下表现优异
国内开源
◈
LongCat-Audio-Codec
美团
高效语音编解码器,助力实时交互落地
国内开源
◈
Fish Audio S1
Fish Audio
表现力语音克隆和文本转语音模型
国内开源
◈
Fish Audio S2 Pro
Fish Audio
多语言TTS,80+语言,1000万小时训练数据,Dual-AR架构
国内开源
◈
Kimi Audio
月之暗面
月之暗面 Kimi Audio 音频多模态模型
国内开源
◈
Sonic-OS
Cartesia
Cartesia开源语音合成模型
国外开源