获取抖音视频连接
得到如下信息: “5.1 HV:/ 守门员戴手套没法系鞋带这种体育精神,值得尊敬%遇见足球 %足球 %精彩进球 %意甲 %唯有足球不 https://v.douyin.com/eDFd28P/ 复制此链接,打开Dou音搜索,直接观看视频!”
通过正则取到信息中的地址:
share_url='5.1 HV:/ 守门员戴手套没法系鞋带这种体育精神,值得尊敬%遇见足球 %足球 %精彩进球 %意甲 %唯有足球不 https://v.douyin.com/eDFd28P/ 复制此链接,打开Dou音搜索,直接观看视频!'
short_url = re.findall('(https?://[^\s]+)', share_url)[0]
访问地址对返回的数据进行分析
通过访问得到的短连接,请求的地址会变成下面的
然后分析返回的数据:
对返回的数据逐个筛选,发现这个连接可以直接访问到视频
对请求的地址重新整理获取源视频的地址:
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36",
}
# 通过分享连接获取跳转的地址
url = requests.get(url=short_url,headers=headers).url
# 通过跳转的地址找到item_id
item_id = re.findall('https://www.iesdouyin.com/share/video/(\d+)',url)[0]
# 请求地址获取数据
rel_url = requests.get(url="https://www.iesdouyin.com/web/api/v2/aweme/iteminfo/?item_ids="+item_id,headers=headers).text
# 筛出视频地址
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0]
如何去除水印
以上步骤中可以得到视频的地址:https://aweme.snssdk.com/aweme/v1/playwm/?video_id=v0300fg10000c29ouk4guk3mmkooa0r0&ratio=720p&line=0
将其中的playwm
替换为play
就可以得到没有水印的地址
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0].replace('/playwm/', '/play/')
整合代码
import requests
import re
import json
down_load_path = 'E:\下载的MP4\\'
class D_y():
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36",
}
def __init__(self,share_url):
self.share_url = share_url
def get_rel_url(self):
short_url = re.findall('(https?://[^\s]+)', self.share_url)[0]
url = requests.get(url=short_url, headers=self.headers).url
# item_id = re.findall('https://www.iesdouyin.com/share/video/(\d+)', url)[0]
item_id = url.split('/')[5]
rel_url = requests.get(url="https://www.iesdouyin.com/web/api/v2/aweme/iteminfo/?item_ids=" + item_id,headers=self.headers).text
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0].replace('/playwm/','/play/')
video = requests.get(url=video_rul,headers=self.headers).content
video_name = json.loads(rel_url)['item_list'][0]['share_info']['share_title'].split('#')[0].split('@')[0].replace(' ','')
with open(down_load_path+str(video_name)+'.mp4','wb') as f:
f.write(video)
f.close()
print("【抖音短视频】: {}.mp4 无水印视频下载完成!".format(video_name))
if __name__ == '__main__':
a = input("url:")
D_y(a).get_rel_url()
大功告成!!!