C++读写EXCEL文件OLE,java读写excel文件POI 对比

C++读写EXCEL文件方式比较

有些朋友问代码的问题,将OLE读写的代码分享在这个地方,大家请自己看。http://www.cnblogs.com/destim/p/5476915.html

C++读取Excel的XLS文件的方法有很多,但是也许就是因为方法太多,大家在选择的时候会很疑惑。

由于前两天要做导表工具,比较了常用的方法,总结一下写个短文,

1.OLE的方式

这个大约是最常用的方式,这个方式其实启动了一个EXCEL的进程在背后读写EXCEL文件,这个方式的最大好处是什么事情都能做。包括设置EXCEL的格式,增加删除Sheet,读写单元格,等等。功能几乎是最全的,而且使用起来也不是特别的难。

其基本方法都是使用导出的.h文件进行OLE操作,但是由于OLE的接口说明文档不多,想非常完美的使用她们也不是太容易,好在例子也很多。

网上普遍认为OLE速度慢,EXCEL的OLE读写方式也基本一样。但是读取速度可以改进,如果在读取的加载整个Sheet的Range的全部数据,而不是一个个单元格读取,那么速度还是相对不错。想想原理也很简单,整体读取减少了OLE的交互次数。OLE的写入方式一般只能几个进行比较方便,所以速度可能要快很多。

我自己的亲身体会是,一个EXCEL文件,100多列的字段,如果采用一个个单元格的读取方式,1s大约3条左右的记录,如果整体读取,速度可以提高几十倍。

OLE读写EXCEL方式功能很强大,读取速度还可以,但写入速度不高,当然这个方式不可能移植的,而且你必须安装了EXCEL。

2.Basic EXCEL 方式

这是CodeProject上的一个推荐开源工程了,

http://www.codeproject.com/KB/office/BasicExcel.aspx

作者是基于EXCEL的文件格式进行的处理。但是为什么叫Basic EXCEL呢。

他不支持很多东西,公式,文件格式,表格合并等(有人说中文支持也不好),所以可以认为他只支持最基本的EXCEL表格,

我自己的尝试是如果这个EXCEL文件有其他元素(公式,格式等),使用Basic EXCEL读取会失败。

OLE读写EXCEL方式功能比较弱,由于是直接根据文件格式操作,读写速度都不错,你也不需要按照EXCEL,另外这个方式是可以移植的,但是有一些成本,其代码比较晦涩难懂,而且没有注释,另外即使在Windows平台上,告警也很多。

3.Sourceforge 上的几个EXCEL库。

Sourceforge 上有几个开源的的EXCEL库,但是完善的不多,有的是为了PHP读写EXCEL准备的,包括libXLS,XLSlib,SmartEXCEL等。我下载了几个实验了一下,在Widonws都没有编译成功。也罢了。

4.ODBC的方式

这个亲身没有尝试过,但是按照原理,应该只能读写。

速度吗,ODBC的速度本来就是出名的慢了。

http://www.vckbase.com/document/viewdoc/?id=421

值得一提的是Basic EXCEL的作者原来在CodeProject上有一个给予ODBC方式的封装CSpreadSheet 。如果有兴趣,大家可以去看看。其实内心还是很佩服这个作者的。

http://www.codeproject.com/KB/database/cspreadsheet.aspx

5.ADO的方式

ADO的方式听说应该就是使用OLEDB的方式。和OLE的方式应该没有本质区别。我看了看例子也和OLE很像

6.LibXL

LibXL 是一个收费的EXCEL的库。

http://www.libxl.com/

按照他的说明,他可以不依赖EXCEL读取XLS文件。包括设置格式等。看例子操作应该很简单。但是是否可以移植到Linux平台,我估计难度也不小。呵呵。

由于要收费,没有法子测试了。

7.网上一些号称不用OLE读取EXCEL例子

初步看了一下,这个应该是网上探索EXCEL格式文档的例子。可以实际操作的方式不强。

第一。

LibXL 目前国内用的人不少。当然他其实没有免费,只是……你在CSDN也能找到了。

其实作者买的也不算太贵了。

第二。

基于QT的代码。

https://github.com/dbzhang800/QtXlsxWriter

这个库可以读取XLSX的格式。其实是这个格式目前也开源了。

当然前提是你用QT,这个工程量优点浩大。

第三,

xlslib,这个库可以读取写入xls格式的

http://sourceforge.net/projects/xlslib/?source=navbar

如果你是用.NET,你就太幸福了。可选的多了取了。

http://blog.wwery.cn/?p=210

什么你想把.NET的库转换为C++可以使用?这个……希望你能成功。

jxl和POI的区别

  首先从优缺点上来说

  一、jxl

优点:

  1. Jxl对中文支持非常好,操作简单,方法看名知意。
  2. Jxl是纯javaAPI,在跨平台上表现的非常完美,代码可以再windows或者Linux上运行而无需重新编写
  3. 支持Excel 95-2000的所有版本(网上说目前可以支持Excel2007了,还没有尝试过)
  4. 生成Excel 2000标准格式
  5. 支持字体、数字、日期操作
  6. 能够修饰单元格属性
  7. 支持图像和图表,但是这套API对图形和图表的支持很有限,而且仅仅识别PNG格式。

缺点:效率低,图片支持不完善,对格式的支持不如POI强大, 2009年后jxl不再更新, poi一直在更新.

二、POI

优点:

  1. 效率高(数据来源:http://blog.csdn.net/jarvis_java/article/details/4924099
  2. 支持公式,宏,一些企业应用上会非常实用
  3. 能够修饰单元格属性
  4. 支持字体、数字、日期操作

缺点:不成熟,代码不能跨平台,貌似不少同行在使用工程中还碰到让人郁闷的BUG(最近的项目中也是遇到了一些bug,不过目前没有查出来是代码的问题还是POI的问题,总之问题很诡异,数据替代参数总有失败的。关于不能跨平台这一说,我也没有试验过,不过Java不是跨平台吗?POI是JAVA的一个组件,怎么就不能跨平台了呢,总之这些问题还需要在以后的项目中多多实践,才能比较出区别之处。)

访问excel表格的方法论。
(1)ODBC方法。利用ODBC把Excel文件当成数据库文件,来进行读、写、修改等操作。首先,应确保ODBC中已安装有Excel表格文件的驱动。无法跨平台。
(2)OLE方法。详细大家可以查看百度百科。不支持跨平台。功能最全面。

(3)文本解析方法。微软开放了excel的格式文档,可以对excel的组成文件直接访问。这也是利用其格式化数据存储的思维方式。

C++读写EXCEL文件OLE,java读写excel文件POI 对比

 
 
上一篇:BPM配置故事之案例13-触发消息通知


下一篇:Tensorflow模型加载与保存、Tensorboard简单使用