在python中获取html标记值

我是python的新手.这是我在python 2.7.5上运行的代码

import urllib2
import sys       

url ="mydomain.com"
usock = urllib2.urlopen(url)
data = usock.read()
usock.close()

print data

像这样获得HTML标记并且它有效.

我想做的是,从里面获取价值< font class =“big”>< / font>标签.对于前我需要此示例中的数据值:

<font class="big">Data</font>

怎么做?

解决方法:

您可以使用HTML解析器模块,例如BeautifulSoup

from bs4 import BeautifulSoup as BS
url ="mydomain.com"
usock = urllib2.urlopen(url)
data = usock.read()
usock.close()
soup = BS(data)
print soup.find('font', {'class':'big'}).text

这会找到一个标签< font>用class =“big”.然后它打印其内容.

上一篇:Golang go-gin路由


下一篇:destoon7.0移动端列表界面调取tag关键词