Kimi Audio 是月之暗面的音频多模态模型,统一音频理解、生成与对话。
核心参数
输入模态
文本
开源状态
开源
规格信息
声音克隆
不支持
流式输出
不支持
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
语音识别
ASR 能力 SOTA
音频理解
分类/情绪/问答
语音生成
端到端 TTS 对话
开源
开源可用
适用场景
开发者
音频应用
常见问题
Kimi Audio是什么?▼
Kimi Audio 是月之暗面的音频多模态模型,统一音频理解、生成与对话。
Kimi Audio的核心参数是什么?▼
Kimi Audio是月之暗面推出的模型,开源模型。
Kimi Audio的API价格是多少?▼
Kimi Audio的API调用价格约为$10.00/Mtoken(输入)。具体价格请以官方为准。
Kimi Audio的评测表现如何?▼
Kimi Audio在多个基准测试中表现优秀:undefined: 4.1等。
Kimi Audio有哪些主要功能?▼
语音识别、音频理解、语音生成、开源
最后更新:2026/5/6数据来源:即客AI模型库
