BeautifulSoup库的简单实用

1、BeautifulSoup库的简单理解

   打开一个简单的html文件(每一对尖括号形成一个标签,标签之间有上下之间的关系,形成了标签树)

    <html>

      <body>

        <p class="title">....</p>

      </body>

    </html>

   BeautifulSoup库是解析、遍历、维护“标签树”的功能库。

   针对其中一个标签进行举例说明:

BeautifulSoup库的简单实用

  2、BeautifulSoup库的引用

    最常用的是:

      from bs4 import BeautifulSoup

    如果我们需要对BeautifulSoup库中的基本变量进行判断的时候可以直接引用:

      import bs4

    简单来说我们可以将BeautifulSoup对应的一个HTML/XML文档的全部内容。  

  3、BeautifulSoup库的解释器

BeautifulSoup库的简单实用

  4、Beautiful Soup类的基本元素

BeautifulSoup库的简单实用

       5、Beautiful Soup类的元素的基本操作

BeautifulSoup库的简单实用

 

上一篇:爬虫三 bs4&xpath&jsonpath


下一篇:DAY03:BS4