python爬取百度在线语音合成的音频

python爬取百度在线语音合成

URL:https://ai.baidu.com/tech/speech/tts_online 添加链接描述
本身百度自带了sdk,为什么要爬取呢?闲的没事干,只用段小的音频,注册下载再调用麻烦。那为什么不自己录个音频呢?我不知道

抓包

python爬取百度在线语音合成的音频
python爬取百度在线语音合成的音频

api从这里抓包,用的post请求,返回的是base64文件格式,代码转码就是音频文件了。(文件格式是.mpeg)下面是转码后的结果
python爬取百度在线语音合成的音频

不废话,直接上代码,代码有点简易。

#开始吧!勤奋的人!
#-*- codeing = utf-8 -*-
#@Time : 2021/01/20 16:03
#@Author : 生命像饼干一样脆弱
#@Software : PyCharm

import requests
from fake_useragent import UserAgent
import base64

url = ' https://ai.baidu.com/aidemo'

headers={
    "UserAgent":UserAgent().random
}
data = {                                #构建post表单数据
    'type': 'tns',
    'per': '4119',  #人物声音类别
    'spd': '5',     #声速
    'pit': '5',     #声调
    'vol': '15',    #声音大小
    'aue': '6',
    'tex': '门已打开,欢迎靓仔'     #需要合成声音的文本
}
res = requests.post(url, data=data)  #post 请求,返回base64文件
print(res)
data = res.json()['data'] #返回数据为json格式,提取里面的data

#f = open('门已打开base64.txt',mode='w')     #打开文件,若文件不存在系统自动创建。
#f.write(data)                  # write 写入,将base64文件保存到.txt文件
#f.close()

#f=open('门已打开base64.txt',mode='r')
#content=f.read()                #读取保存数据,检查是否存在
#print(content)
#f.close()


n_data = data.split(",")[1]       # base64解成原本格式保存本地,需要把data:base64协议给去掉
ret = base64.b64decode(n_data, altchars=None, validate=False)  #ret base64解码后的二进制文件
print(ret)

f = open('./门已打开.mpeg',mode='wb')     。
f.write(ret)                       
f.close()


上一篇:1月21日学习总结


下一篇:自然语言处理之关键词提取TF-IDF