第4关爬虫进阶爬取整个网站

2023-11-25 23:44:40

课程目录扇贝编程 - 爬虫和办公自动化

Hi~ o(￣▽￣)ブ，我们又见面了。上一关中，我们学会了使用 BeautifulSoup 解析和提取数据。解析数据的方法如下：

然后学习了 BeautifulSoup 对象 中的 find() 和 find_all() 方法，完成了对网页源代码初步的筛选。我们再回顾一下这两个方法的作用和区别：

我们还知道了 find() 和 find_all() 方法的返回值分别是 Tag 对象 和由 Tag 对象 组成的列表。我给你总结了 Tag 对象 的常用属性与方法：

我们还简单了解了 CSS 选择器 的用法，如果对其熟悉的话，可以快速高效地定位到我们所需的