便携式通用语音克隆系统可合成制作目标人物任意讲话的音视频,并输出文件供官兵使用,产品用于心理作战场景,产品使用的硬件平台为jetson nano,主要使用的开发语言有:c++,c,python,shell。
系统部分:完成语音克隆系统在jetson-nano机器上运行环境搭建,之前用的是jetson-agx,使得每台设备降低了5k成本;完成系统包的制作,使得产品可以批量;由于ai模型占内存比较多,
jetson-nano4g内存不够用,通过虚拟内存技术解决了内存不够的问题;
驱动部分:完成音频驱动开发,包括音频录制,音频播放;完成电池电量驱动开发,完成音量调节驱动开发;触摸屏异常问题的解决;
qt部分:完成开机视频动画,虚拟键盘及中文输入法开发,全部人机交互系统的开发;
相关文章
- 10-19jd1