C++读写EXCEL文件方式比较
有些朋友问代码的问题,将OLE读写的代码分享在这个地方,大家请自己看。http://www.cnblogs.com/destim/p/5476915.html
C++读取Excel的XLS文件的方法有很多,但是也许就是因为方法太多,大家在选择的时候会很疑惑。
由于前两天要做导表工具,比较了常用的方法,总结一下写个短文,
1.OLE的方式
这个大约是最常用的方式,这个方式其实启动了一个EXCEL的进程在背后读写EXCEL文件,这个方式的最大好处是什么事情都能做。包括设置EXCEL的格式,增加删除Sheet,读写单元格,等等。功能几乎是最全的,而且使用起来也不是特别的难。
其基本方法都是使用导出的.h文件进行OLE操作,但是由于OLE的接口说明文档不多,想非常完美的使用她们也不是太容易,好在例子也很多。
网上普遍认为OLE速度慢,EXCEL的OLE读写方式也基本一样。但是读取速度可以改进,如果在读取的加载整个Sheet的Range的全部数据,而不是一个个单元格读取,那么速度还是相对不错。想想原理也很简单,整体读取减少了OLE的交互次数。OLE的写入方式一般只能几个进行比较方便,所以速度可能要快很多。
我自己的亲身体会是,一个EXCEL文件,100多列的字段,如果采用一个个单元格的读取方式,1s大约3条左右的记录,如果整体读取,速度可以提高几十倍。
OLE读写EXCEL方式功能很强大,读取速度还可以,但写入速度不高,当然这个方式不可能移植的,而且你必须安装了EXCEL。
2.Basic EXCEL 方式
这是CodeProject上的一个推荐开源工程了,
http://www.codeproject.com/KB/office/BasicExcel.aspx
作者是基于EXCEL的文件格式进行的处理。但是为什么叫Basic EXCEL呢。
他不支持很多东西,公式,文件格式,表格合并等(有人说中文支持也不好),所以可以认为他只支持最基本的EXCEL表格,
我自己的尝试是如果这个EXCEL文件有其他元素(公式,格式等),使用Basic EXCEL读取会失败。
OLE读写EXCEL方式功能比较弱,由于是直接根据文件格式操作,读写速度都不错,你也不需要按照EXCEL,另外这个方式是可以移植的,但是有一些成本,其代码比较晦涩难懂,而且没有注释,另外即使在Windows平台上,告警也很多。
3.Sourceforge 上的几个EXCEL库。
Sourceforge 上有几个开源的的EXCEL库,但是完善的不多,有的是为了PHP读写EXCEL准备的,包括libXLS,XLSlib,SmartEXCEL等。我下载了几个实验了一下,在Widonws都没有编译成功。也罢了。
4.ODBC的方式
这个亲身没有尝试过,但是按照原理,应该只能读写。
速度吗,ODBC的速度本来就是出名的慢了。
http://www.vckbase.com/document/viewdoc/?id=421
值得一提的是Basic EXCEL的作者原来在CodeProject上有一个给予ODBC方式的封装CSpreadSheet 。如果有兴趣,大家可以去看看。其实内心还是很佩服这个作者的。
http://www.codeproject.com/KB/database/cspreadsheet.aspx
5.ADO的方式
ADO的方式听说应该就是使用OLEDB的方式。和OLE的方式应该没有本质区别。我看了看例子也和OLE很像
6.LibXL
LibXL 是一个收费的EXCEL的库。
按照他的说明,他可以不依赖EXCEL读取XLS文件。包括设置格式等。看例子操作应该很简单。但是是否可以移植到Linux平台,我估计难度也不小。呵呵。
由于要收费,没有法子测试了。
7.网上一些号称不用OLE读取EXCEL例子
初步看了一下,这个应该是网上探索EXCEL格式文档的例子。可以实际操作的方式不强。
第一。
LibXL 目前国内用的人不少。当然他其实没有免费,只是……你在CSDN也能找到了。
其实作者买的也不算太贵了。
第二。
基于QT的代码。
https://github.com/dbzhang800/QtXlsxWriter
这个库可以读取XLSX的格式。其实是这个格式目前也开源了。
当然前提是你用QT,这个工程量优点浩大。
第三,
xlslib,这个库可以读取写入xls格式的
http://sourceforge.net/projects/xlslib/?source=navbar
如果你是用.NET,你就太幸福了。可选的多了取了。
http://blog.wwery.cn/?p=210
什么你想把.NET的库转换为C++可以使用?这个……希望你能成功。
首先从优缺点上来说
一、jxl
优点:
- Jxl对中文支持非常好,操作简单,方法看名知意。
- Jxl是纯javaAPI,在跨平台上表现的非常完美,代码可以再windows或者Linux上运行而无需重新编写
- 支持Excel 95-2000的所有版本(网上说目前可以支持Excel2007了,还没有尝试过)
- 生成Excel 2000标准格式
- 支持字体、数字、日期操作
- 能够修饰单元格属性
- 支持图像和图表,但是这套API对图形和图表的支持很有限,而且仅仅识别PNG格式。
缺点:效率低,图片支持不完善,对格式的支持不如POI强大, 2009年后jxl不再更新, poi一直在更新.
二、POI
优点:
- 效率高(数据来源:http://blog.csdn.net/jarvis_java/article/details/4924099)
- 支持公式,宏,一些企业应用上会非常实用
- 能够修饰单元格属性
- 支持字体、数字、日期操作
缺点:不成熟,代码不能跨平台,貌似不少同行在使用工程中还碰到让人郁闷的BUG(最近的项目中也是遇到了一些bug,不过目前没有查出来是代码的问题还是POI的问题,总之问题很诡异,数据替代参数总有失败的。关于不能跨平台这一说,我也没有试验过,不过Java不是跨平台吗?POI是JAVA的一个组件,怎么就不能跨平台了呢,总之这些问题还需要在以后的项目中多多实践,才能比较出区别之处。)
访问excel表格的方法论。
(1)ODBC方法。利用ODBC把Excel文件当成数据库文件,来进行读、写、修改等操作。首先,应确保ODBC中已安装有Excel表格文件的驱动。无法跨平台。
(2)OLE方法。详细大家可以查看百度百科。不支持跨平台。功能最全面。
(3)文本解析方法。微软开放了excel的格式文档,可以对excel的组成文件直接访问。这也是利用其格式化数据存储的思维方式。