理解自动语音识别的核心技术,掌握Whisper等主流ASR模型的使用方法。ASR原理:声学模型、语言模型、解码器;Whisper架构:多语言、多任务语音模型;端到端ASR:CTC、Attention、Transducer;实时ASR:流式识别、低延迟优化;ASR评估:WER、CER指标。
Whisper官方介绍
百度ASR文档