经多次测试发现:
lxml中的etree格式化以后,直接使用firefox或chrome提取的xpath检索不到内容。
主要是因为tbody
# 车种xpath
czxx = '/html/body/table/tbody/tr/td/table/tbody/tr[1]/td[7]'
# 车型xpath
cxxx = '/html/body/table/tr/td/table/tr[1]/td[5]'
看上面两个,去掉tbody就可以了。
上面两个xpath是用firefox提取的。
下面是chrome提取的,也是要去掉tbody
# 车种xpath
czxx = '//*[@id="report1"]/tr[1]/td[7]'
# 车型xpath
cxxx = '//*[@id="report1"]/tr[1]/td[5]'