1、入门课程:
深蓝学院的语音识别从入门到精通的第二课,主要讲了语音的FBank和MFCC特征提取。
2、代码实践:
自己不太会,所以先看了别人的代码然后一句一句弄懂,现在我也可以独立编出来。
3、有不理解的时候搜索的相关资料:
代码部分的解释说明:
a.语音识别之——音频特征fbank与mfcc,代码实现与分析 - mashuangwe的文章 - 知乎 https://zhuanlan.zhihu.com/p/130926693
b.https://blog.csdn.net/Magical_Bubble/article/details/90295814
MFCC的进一步理论说明:
https://blog.csdn.net/class_brick/article/details/82743741
https://www.pianshen.com/article/18461161860/
https://blog.csdn.net/tengfei0973/article/details/103182621
关于MFCC其他维特征的说明:
能量 语音处理中MFCC里MFCC系数中的log energy系数是什么? - Leon晋的回答 - 知乎 https://www.zhihu.com/question/265796794/answer/298771647
一阶差分二阶差分 https://blog.csdn.net/zhangxueyang1/article/details/54232635?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~sobaiduend~default-2-54232635.nonecase&utm_term=%E4%B8%89%E8%A7%92%E5%B8%A6%E9%80%9A%E6%BB%A4%E6%B3%A2%E5%99%A8&spm=1000.2123.3001.4430