导航菜单

切换主题

🎵 音频模型

共 6 个模型

TTS语音合成 (33)音频转录 (0)语音识别 (12)音乐生成 (13)音频克隆 (1)

全部国内 (5)国外 (1)

仅主流模型仅开源模型

最新发布发布时间名称 A-Z 名称 Z-A

✕ 清除筛选

其他模型(6)

MiMo V2.5 ASR

小米语音识别模型，支持中英双语、中文方言、Code-Switch，在强噪音、多说话人场景下表现优异

LongCat-Audio-Codec

高效语音编解码器，助力实时交互落地

Fish Audio S1

表现力语音克隆和文本转语音模型

Fish Audio S2 Pro

多语言TTS，80+语言，1000万小时训练数据，Dual-AR架构

Kimi Audio

月之暗面 Kimi Audio 音频多模态模型

Sonic-OS

Cartesia开源语音合成模型