因为经常会涉及到从Excel表中导数据,所以就学习了python的xlrd来读取excel中的数据。
1.xlrd的安装
xlrd是python的第三方库,所以是需要自己安装的,可以在python的官网http://pypi.python.org/pypi/xlrd下载该模块来安装,也可以通过其他手段,比如easy_install或者pip啥的,我已经安装好pip所以就用最懒的方式来安装了pip install xlrd来安装。
2.分析excel文件的层级对象
要读取excel的数据,就要了解excel的结构,根据excel的结构一层一层的去读取数据。
excel有三层级对象,workbook,sheet,和cell。一个excel文件就是一个workbook,所以在最初我们必须要打开这个excel文件,也就是workbook。sheet我们都很熟悉,就是表,我们都知道一个excel文件有时候会有很多的表,所以我们必须要选择是读取哪个表的数据,最后才是cell,cell其实就是格子,excel的表格就是一个二维数组,cell就是这个表格中的最小单元,也就是我们读取数据存储的地方。
3.xlrd读取excel的基本操作
python是一个很强大的脚本语言,之所以强大是因为它的库很强大,xlrd作为python的第三方库已经将读取excel文件的各个操作封装好了,我们只需要调用它提供的一些接口就可以很快速简单的读取数据。下面看看最基本的操作。
1).打开一个excel文件得到数据:
data = xlrd.open_workbook("test.xls")
2).获取一个表格数据
table = data.sheets()[0] #通过索引获取 table = data.sheet_by_index(0) #通过索引获取 table = data.sheet_by_name(‘set‘) #通过表名获取
3).获取表格数据
nrows = table.nrows #行数 ncols = table.ncols #列数 data = table.cell(nrow, ncol).value #得到表格数据 #获取每行每列的数据 for i in range(0, nrows): for j in range(0, ncols): data = table.cell(i, j).value