导航菜单
切换主题
Kimi Audio

Kimi Audio

开源

月之暗面 Kimi Audio 音频多模态模型

Kimi Audio 是月之暗面的音频多模态模型,统一音频理解、生成与对话。

核心参数

输入模态
文本
开源状态
开源

规格信息

声音克隆
不支持
流式输出
不支持

API 定价

🌱 开源模型

该模型为开源模型,可免费使用或自行部署

功能特性

语音识别

ASR 能力 SOTA

音频理解

分类/情绪/问答

语音生成

端到端 TTS 对话

开源

开源可用

适用场景

开发者

音频应用

常见问题

Kimi Audio是什么?
Kimi Audio 是月之暗面的音频多模态模型,统一音频理解、生成与对话。
Kimi Audio的核心参数是什么?
Kimi Audio是月之暗面推出的模型,开源模型。
Kimi Audio的API价格是多少?
Kimi Audio的API调用价格约为$10.00/Mtoken(输入)。具体价格请以官方为准。
Kimi Audio的评测表现如何?
Kimi Audio在多个基准测试中表现优秀:undefined: 4.1等。
Kimi Audio有哪些主要功能?
语音识别、音频理解、语音生成、开源
最后更新:2026/5/6数据来源:即客AI模型库