SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载

阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

SenseVoice:精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可
上一篇:【Soc级系统防御】PCB安全威胁与防御策略:攻击模型与实践指南


下一篇:汽车免拆诊断案例 | 2016款保时捷Macan车发动机故障灯异常点亮-故障现象 一辆2016款保时捷Macan车,搭载CYP发动机,累计行驶里程约为11.2万km。车主进厂反映,发动机故障灯异常点亮。 故障诊断 接车后试车,发动机怠速无明显异常,组合仪表上的发动机故障灯异常点亮。用故障检测仪检测,发现发动机控制单元(DME)中存储有故障代码“P11A600 气缸2排气门升程调节A-信号不可信”(图1)。 图1DME中存储的故障代码 查看维修资料得知,该车发动机进气门的气门升程不可以调节,但排气门的气门升程可以进行两级调节,工作原理与奥迪可变气门升程系统(AVS)一样。如图2所示,凸轮块安装在排气凸轮轴上,可以轴向移动。紧密相邻的是2个外形不同的凸轮,一个升程小,一个升程大。改变凸轮块位置,就可以按负荷状态来控制排气门的升程。 图2排气凸轮轴的结构 凸轮块的轴向移动由2个带金属销的升程调节执行元件控制。如图3所示,左侧凸轮轴调节执行元件工作,伸出金属销,插在凸轮块上的螺旋