2021-04-24:树形结构,下/上/平行遍历,prettify()方法

树形结构采用标签的形式来组织,但是标签之间的NavigableString也构成了标签之间的节点。所以任何一个节点的平行/父/子标签可能存在NavigableString类型
2021-04-24:树形结构,下/上/平行遍历,prettify()方法

1.下行遍历

import requests
from bs4 import BeautifulSoup


r = requests.get('https://python123.io/ws/demo.html')
demo = r.text
# 提供demo和解析器
soup = BeautifulSoup(demo, 'html.parser')
print(soup)
print('\n-----------------------------')
for i in soup.body.descendants:
    print('分界线')
    print(f'{i}\n')
  1. .contents返回列表类型,children和descendants返回迭代类型
  2. descendants包含每一个children

2021-04-24:树形结构,下/上/平行遍历,prettify()方法
2.上行遍历
可以用.parent.parent
2021-04-24:树形结构,下/上/平行遍历,prettify()方法

3.平行遍历
只能遍历同一父标签下的平行标签,注意不包括平行标签的下行标签

2021-04-24:树形结构,下/上/平行遍历,prettify()方法
4.prettify()方法
该方法给标签添加换行符,让标签展现的更直观
soup.prettify()
soup.a.prettify()

上一篇:七日Python之路--第八天(一些琐碎)


下一篇:python爬虫之Beautiful Soup库(3)