urllib库下载网页源码,图片,视频测试

测试代码:

import urllib.request # 导入库

# url

url_page =‘http://www.baidu.com’

下载网页源码

# 下载网页的HTML文件

urllib.request.urlretrieve(url_page, ‘baidu.html’)

执行上代码后,就成功下在了百度网页的源码。

urllib库下载网页源码,图片,视频测试

打开这个baidu.html

urllib库下载网页源码,图片,视频测试

下载图片

找到网页图片地址的url后,就可以下载图片了。这里只是演示,打开一个网址,找到一个图片,鼠标右键,复制图片地址。

urllib库下载网页源码,图片,视频测试

# 下载图片

url_img =‘https://upload.jianshu.io/users/upload_avatars/26915479/01ac58e9-ad4d-4b8d-a96e-0b0342d2107c?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240’

urllib.request.urlretrieve(url=url_img, filename=‘my.jpg’)

在执行的目录下立即创建了一个my.jpg的图片了。
urllib库下载网页源码,图片,视频测试

下载视频

同理,可以找到一个小视频测试,比如在西瓜视频网站,找任意一个视频地址来测试

url_video =‘https://www.youtube.com/watch?v=mjWpopBIbaE’

urllib.request.urlretrieve(url=url_video, filename=‘download.mp4’)

速度有些慢,耐心点,可以在执行路径创建一个download.mp4,使用安装的视频播放器可直接播放,pycharm是否不能直接播放的。

上一篇:oracle c函数批量查询工具


下一篇:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 339: invalid continuation byte