爬取某个网址高清图片

本程序用到Python
用到的库requests,lxml
输入网址,
url = ''
获取源代码
ht = etree.HTML(a.text)
找到a标签中的href属性值
href_list = ht.xpath('//*[@id="showImg"]/li/a/@href')
利用循环语句获取多个a标签中的href属性值
for i in href_list:
在获取a标签中的链接源代码
html_img = etree.HTML(src.text)
找到的src属性值
img_ = html_img.xpath('/html/body/img[1]/@src')[0]
打印src属性值,图片的链接
print(img_)

代码
import requests
from lxml import etree

url = 'https://xxxx.xxx.com.cn/bizhi/5336_65991_2.html'

href_url = 'https://xxxx.xxx.com.cn'

a = requests.get(url)

ht = etree.HTML(a.text)

href_list = ht.xpath('//*[@id="showImg"]/li/a/@href')

for i in href_list:
a_url = href_url+i
onclick = requests.get(a_url)
htm = etree.HTML(onclick.text)
img_url = htm.xpath('//*[@id="tagfbl"]/a/@href')[0]
img_src = href_url + img_url
src = requests.get(img_src)
html_img = etree.HTML(src.text)
img_ = html_img.xpath('/html/body/img[1]/@src')[0]
print('"'+img_+'",')

上一篇:技术分享 | P450-详解室内外指点飞行来啦


下一篇:Ubuntu20.04配置PX4环境启动或编译jmavsim 出现的错误及解决办法