Python学习案例之Web版语音合成播报

Python学习案例之Web版语音合成播报

前言

语音合成技术能将用户输入的文字,转换成流畅自然的语音输出,并且可以支持语速、音调、音量设置,打破传统文字式人机交互的方式,让人机沟通更自然。

应用场景

将游戏场景中的公告、任务或派单信息通过语音播报,让玩家玩游戏或配送员送货的同时,也可接听新任务。

文学小说类软件,可以利用百度语音合成技术将文学小说作品进行高质量的朗读,流畅清晰,解放双眼,畅听世界。

软件架构

Python3.7.2、Django2.1.7、baidu-aip(百度语音API)

案例

这里只展示部分代码,有兴趣的同学可以自行下载源码安装调试。

import osimport timeimport codecsfrom aip import AipSpeechfrom django.shortcuts import renderfrom django.http import HttpResponse'''
pip install --upgrade pip
pip install django
pip install baidu-aip
'''def main(request):
    return render(request, 'index.html')def m_main(request):
    return render(request, 'm_index.html')def convert(request):
    message = request.POST.get("message")
    switch = request.POST.get("switch")
    mp3 = du_say(message, switch)    return HttpResponse(mp3)def du_say(message, switch):
    write_txt(message)
    app_id = '*****'
    api_key = '*****'
    secret_key = '*****'
    client = AipSpeech(app_id, api_key, secret_key)    if switch == "true":
        switch = 3
    else:
        switch = 4
    result = client.synthesis(message, 'zh', 1, {        'vol': 5, 'per': switch,
    })
    t = time.time()
    now_time = lambda: int(round(t * 1000))
    path = os.getcwd() + os.path.sep + "static" + os.path.sep + "audio"+os.path.sep
    audio = path+str(now_time())+'.mp3'
    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码
    if not isinstance(result, dict):        with open(audio, 'wb') as f:
            f.write(result)    return str(now_time())+'.mp3'def write_txt(message):
    t = time.time()
    now_time = lambda: int(round(t * 1000))
    path = os.getcwd() + os.path.sep + "static" + os.path.sep + "text"+os.path.sep
    text = path+str(now_time())+'.txt'
    with codecs.open(text, 'a', encoding='utf8')as f:
        f.write(message)

本地部署

从码云拉取项目到本地:

https://gitee.com/52itstyle/baidu-speech.git

配置百度语音API:

# 自行注册申请https://console.bce.baidu.com/ai/#/ai/speech/app/list

启动项目:

# 切换到项目根目录,执行manage.py runserver

Python学习案例之Web版语音合成播报

外网部署

这里以Linux为例,代理使用 openresty。

安装 Python3

wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1.tar.xz

事先安装依赖,否则后期安装会报错:

yum -y install zlib*yum -y install libffi-devel

下面开始正式安装:

# 解压tar -xvf Python-3.7.1.tar.xz# 切换大目录cd Python-3.7.1# 配置编译./configure# 编译安装make && make install

安装 Django

pip install Django

安装成功以后需要重新配置并编译安装 Python3:

# 配置编译./configure# 编译安装make && make install
安装服务器 uwsgi
pip3 install uwsgi

上传项目到服务器,并切换到 speech 目录:

# 目录下新建文件夹mkdir script

在 script 下新增 uwsgi.ini (项目中已经配置好,自行修改路径即可):

# uwsig使用配置文件启动[uwsgi]# 项目目录chdir=/www/speech/# 指定项目的applicationmodule=speech.wsgi:application# 指定sock的文件路径       socket=/www/speech/script/uwsgi.sock# 进程个数       workers=5pidfile=/www/speech/script/uwsgi.pid# 指定IP端口       http=127.0.0.1:8001# 指定静态文件static-map=/static=/www/speech/static# 启动uwsgi的用户名和用户组uid=rootgid=root# 启用主进程master=true# 自动移除unix Socket和pid文件当服务停止的时候vacuum=true# 序列化接受的内容,如果可能的话thunder-lock=true# 启用线程enable-threads=true# 设置自中断时间harakiri=30# 设置缓冲post-buffering=4096# 设置日志目录daemonize=/www/speech/script/uwsgi.log

然后使用以下命令启动:

uwsgi  --ini uwsgi.ini

执行命令,查看是否启动成功:

[root@AY140216131049Z script]# ps -ef|grep uwsgi  root      3040     1  0 Nov21 ?        00:00:03 uwsgi --ini uwsgi.iniroot      3041  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      3042  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      3043  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      3044  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      3045  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      3046  3040  0 Nov21 ?        00:00:00 uwsgi --ini uwsgi.iniroot      6606  6580  0 18:13 pts/0    00:00:00 grep --color=auto uwsgi

重启:

uwsgi --reload uwsgi.pid
配置Nginx代理:
server {        listen  80;        server_name  speech.52itstyle.vip;        charset utf-8;        location / {           include uwsgi_params; # 导入一个Nginx模块他是用来和uWSGI进行通讯的
           uwsgi_connect_timeout 30; # 设置连接uWSGI超时时间
           uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有动态请求就会直接丢给他
        }        # 动静分离 Nginx 处理静态请求
        location /static {            root /www/speech/;
        }
   }

如果启动HTTPS:

server {         listen 80;         listen 443 ssl;         server_name  speech.52itstyle.vip;         #ssl on;
         #证书路径
         ssl_certificate    /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.pem;         #私钥路径
         ssl_certificate_key   /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.key;         #缓存有效期
         ssl_session_timeout 5m;         #可选的加密算法,顺序很重要,越靠前的优先级越高.
         ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4;         #安全链接可选的加密协议
         ssl_protocols TLSv1 TLSv1.1 TLSv1.2;         ssl_prefer_server_ciphers on;        location / {           include uwsgi_params; # 导入一个Nginx模块他是用来和uWSGI进行通讯的
           uwsgi_connect_timeout 30; # 设置连接uWSGI超时时间
           uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有动态请求就会直接丢给他
        }        # 动静分离 Nginx 处理静态请求
        location /static {            root /www/speech/;
        }
   }

演示地址

https://speech.52itstyle.vip/

Python学习案例之Web版语音合成播报
▲扫描二维码识别语音播报

参考

https://gitee.com/52itstyle/baidu-speech

https://blog.52itstyle.vip/archives/3474/

https://blog.52itstyle.vip/archives/3503/


上一篇:自然语言处理的研究方向


下一篇:手机微信语音批量转文字 使用百度语音识别