pands模块的妙用爬取网页中的表格

拿我这篇为例https://www.cnblogs.com/pythonywy/p/11574340.html

import pandas as  pd

df = pd.read_html('https://www.cnblogs.com/pythonywy/p/11574340.html')
print(df)
'''[             设备 rpx换算px (屏幕宽度/750) px换算rpx (750/屏幕宽度)
0       iPhone5      1rpx = 0.42px      1px = 2.34rpx
1       iPhone6       1rpx = 0.5px         1px = 2rpx
2  iPhone6 Plus     1rpx = 0.552px      1px = 1.81rpx,                 选择器              样例                             样例描述
0            .class          .intro         选择所有拥有 class="intro" 的组件
1               #id      #firstname          选择拥有 id="firstname" 的组件
2           element            view                     选择所有 view 组件
3  element, element  view, checkbox  选择所有文档的 view 组件和所有的 checkbox 组件
4           ::after     view::after                  在 view 组件后边插入内容
5          ::before    view::before                  在 view 组件前边插入内容]
'''

主要就是处理一些特别的网站,

pands用法点我

上一篇:Numpy、Matplotlib和Pands


下一篇:Design Pattern - Chain of Responsibility(Java)