2020-12-08

文章目录


BeatifulSoup提供的用于数据解析的方法与属性

今天我们学习BeatifulSoup提供的用于数据解析的方法与属性,先暂时介绍3个方法与属性。有soup.tagName,soup.find(),select。下面我深入了解一下吧。


提示:以下是本篇文章正文内容,下面案例可供参考

一、soup.tagName

soup.tagName用于返回网页源代码文档中第一次出现的tagName对应的标签。
print(sopu.div)
#返回的时html中第一次出现的div标签

二、soup.find()

1.soup.find()

1.soup.find('div'):等价于soup.div。 其中tagName=div 2.用于属性定位: soup.find('div',class_/id/attr)
print(soup.find('div'))#等价于print(soup.div)
print(soup.find('div',class_='song'))
#定位找到song类属性的div标签

2.sopu.find_all()

soup.find_all():用于返回符合要求的所有标签(存储在一个列表中)

代码如下(示例):

print(soup.find_all('a'))
#返回所有a标签

三、select

1.select(‘某种选择器(id,class,标签…选择器)’)返回一个列表
2.层级选择器:
a.soup.select(‘tang > ul > li > a’)>表示一个层级
b.soup.select(‘tang > ul a’)空格表示多个层级

print(soup.select('tang > ul > li > a')[0])
print(soup.select('tang > ul  a')[0])
上一篇:python爬虫——大学排名


下一篇:为了学爬虫,我用三步爬取了大佬崔庆才爬虫相关文章,并保持为pdf学习