目录
1.Beautiful Soup 4 介绍
Beautiful Soup4(BS4)是Python的一个第三方库,用来从HTML和XML中提取数据。
Beautiful Soup4 在某些方面比XPath易懂,但是不如XPath简洁,而且由于它是使用Python开发的,因此速度比XPath慢。
注意,在安装beautifulsoup4时数字“4”不能省略,因为还有一个第三方库叫beautifulsoup,但是它已经停止开发了。
导入第三方库:
from bs4 import BeautifulSoup