【无标题】

当当网的书籍信息

# 发送请求
import requests
# 确定 url 地址
url = 'http://book.dangdang.com/?_utm_brand_id=11106&_ddclickunion=460-5-biaoti|ad_type=0|sys_id=1'
# 添加请求头 headers(User—Agent)
headers = {
    'User—Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36'
           }
# 发送请求,获取数据
response = requests.get(url,headers)
# <Response [200]> 状态码,请求成功
#print(response.text)#字符串
#解析数据
#数据解析模块
import parsel
selector = parsel.Selector(response.text)#转换成 selector 对象
#css 选择器,根据标签属性,右键 copy
lis = selector.css('#component_403754__5298_5294__5294 > li')
#print(lis)
for li in lis:
    title = li.css('.name a::attr(title)').get()
    print(title)

【无标题】
价格那一栏是整数和小数分开的,把字符串合并一下。
【无标题】

上一篇:Ribbon RestTemplate 的使用方法


下一篇:Python2.7:字符转UFT-8、GBK、BIG5并得到bytes