python爬取百度在线语音合成
URL:https://ai.baidu.com/tech/speech/tts_online 添加链接描述
本身百度自带了sdk,为什么要爬取呢?闲的没事干,只用段小的音频,注册下载再调用麻烦。那为什么不自己录个音频呢?我不知道
抓包
api从这里抓包,用的post请求,返回的是base64文件格式,代码转码就是音频文件了。(文件格式是.mpeg)下面是转码后的结果
不废话,直接上代码,代码有点简易。
#开始吧!勤奋的人!
#-*- codeing = utf-8 -*-
#@Time : 2021/01/20 16:03
#@Author : 生命像饼干一样脆弱
#@Software : PyCharm
import requests
from fake_useragent import UserAgent
import base64
url = ' https://ai.baidu.com/aidemo'
headers={
"UserAgent":UserAgent().random
}
data = { #构建post表单数据
'type': 'tns',
'per': '4119', #人物声音类别
'spd': '5', #声速
'pit': '5', #声调
'vol': '15', #声音大小
'aue': '6',
'tex': '门已打开,欢迎靓仔' #需要合成声音的文本
}
res = requests.post(url, data=data) #post 请求,返回base64文件
print(res)
data = res.json()['data'] #返回数据为json格式,提取里面的data
#f = open('门已打开base64.txt',mode='w') #打开文件,若文件不存在系统自动创建。
#f.write(data) # write 写入,将base64文件保存到.txt文件
#f.close()
#f=open('门已打开base64.txt',mode='r')
#content=f.read() #读取保存数据,检查是否存在
#print(content)
#f.close()
n_data = data.split(",")[1] # base64解成原本格式保存本地,需要把data:base64协议给去掉
ret = base64.b64decode(n_data, altchars=None, validate=False) #ret base64解码后的二进制文件
print(ret)
f = open('./门已打开.mpeg',mode='wb') 。
f.write(ret)
f.close()