第4关 爬虫进阶 爬取整个网站

课程目录 扇贝编程 - 爬虫和办公自动化

Hi~ o( ̄▽ ̄)ブ,我们又见面了。上一关中,我们学会了使用 BeautifulSoup 解析和提取数据。解析数据的方法如下:

第4关 爬虫进阶 爬取整个网站

然后学习了 BeautifulSoup 对象 中的 find()find_all() 方法,完成了对网页源代码初步的筛选。我们再回顾一下这两个方法的作用和区别:

第4关 爬虫进阶 爬取整个网站

我们还知道了 find()find_all() 方法的返回值分别是 Tag 对象 和由 Tag 对象 组成的列表。我给你总结了 Tag 对象 的常用属性与方法:

第4关 爬虫进阶 爬取整个网站

我们还简单了解了 CSS 选择器 的用法,如果对其熟悉的话,可以快速高效地定位到我们所需的

上一篇:Python爬虫精进-第2关博客爬虫


下一篇:SQL语言知识点总结