c#操作excel文件 c# 通过NPOI类库实现读取excel文件

NPOI是指构建在POI 3.x版本之上的一个程序,NPOI可以在没有安装Office的情况下对Word或Excel文档进行读写操作。

直接上代码,这里我引用的事1.2.5版本,因为我项目是2.0的,不支持高版本

这里我是转成了datatable类型了,大家可以根据需求不一定要转换,可以直接操作sheet对象

public static DataTable LoadDataFromExcelByNPOI(string fileName)
        {
            FileStream fs = new FileStream(fileName, FileMode.OpenOrCreate); //读取文件流
            HSSFWorkbook workbook = new HSSFWorkbook(fs);  //根据EXCEL文件流初始化工作簿
            workbook.ForceFormulaRecalculation = true;//这里设置为获取值,就不用获取公式了
            var sheet1 = workbook.GetSheetAt(0); //获取第一个sheet
            DataTable table = new DataTable();//
            var row1 = sheet1.GetRow(0);//获取第一行即标头
            int cellCount = row1.LastCellNum; //第一行的列数
            //把第一行的数据添加到datatable的列名
            for (int i = row1.FirstCellNum; i < cellCount; i++)
            {
                string columnVaulue = "F" + (i + 1);
                if (row1.GetCell(i)!=null && !string.IsNullOrEmpty(row1.GetCell(i).StringCellValue))
                {
                    columnVaulue = row1.GetCell(i).StringCellValue;
                }
                DataColumn column = new DataColumn(columnVaulue);
                table.Columns.Add(column);
            }
            int rowCount = sheet1.LastRowNum; //总行数
            //把每行数据添加到datatable中
            for (int i = (sheet1.FirstRowNum + 1); i < sheet1.LastRowNum; i++)
            {
                var row = sheet1.GetRow(i);
                DataRow dataRow = table.NewRow();

                for (int j = row.FirstCellNum; j < cellCount; j++)
                {
                    if (row.GetCell(j) != null)
                    {
                        row.GetCell(j).SetCellType(NPOI.SS.UserModel.CellType.STRING);//这里设置为获取值,就不用获取公式了
                        dataRow[j] = row.GetCell(j).ToString();
                    }
                }
                table.Rows.Add(dataRow);
            }
            //到这里 table 已经可以用来做数据源使用了
            workbook = null; //清空工作簿--释放资源
            sheet1 = null;  //清空sheet
            return table;
        }

(一)传统操作Excel遇到的问题:

1、如果是.NET,需要在服务器端装Office,且及时更新它,以防漏洞,还需要设定权限允许.NET访问COM+,如果在导出过程中出问题可能导致服务器宕机。

2、Excel会把只包含数字的列进行类型转换,本来是文本型的,Excel会将其转成数值型的,比如编号000123会变成123。

3、导出时,如果字段内容以“-”或“=”开头,Excel会把它当成公式进行,会报错。

4、Excel会根据Excel文件前8行分析数据类型,如果正好你前8行某一列只是数字,那它会认为该列为数值型,自动将该列转变成类似1.42702E+17格式,日期列变成包含日期和数字的。

(二)使用NPOI的优势

1、您可以完全免费使用该框架

2、包含了大部分EXCEL的特性(单元格样式、数据格式、公式等等)

3、专业的技术支持服务(24*7全天候) (非免费)

4、支持处理的文件格式包括xlsxlsxdocx.

5、采用面向接口的设计架构( 可以查看 NPOI.SS 的命名空间)

6、同时支持文件的导入和导出

7、基于.net 2.0 也支持xlsx 和 docx格式(当然也支持.net 4.0)

8、来自全世界大量成功且真实的测试Cases

9、大量的实例代码

11、你不需要在服务器上安装微软的Office,可以避免版权问题。

12、使用起来比Office PIAAPI更加方便,更人性化。

13、你不用去花大力气维护NPOINPOI Team会不断更新、改善NPOI,绝对省成本。

14、不仅仅对与Excel可以进行操作,对于doc、ppt文件也可以做对应的操作

NPOI之所以强大,并不是因为它支持导出Excel,而是因为它支持导入Excel,并能“理解”OLE2文档结构,这也是其他一些Excel读写库比较弱的方面。通常,读入并理解结构远比导出来得复杂,因为导入你必须假设一切情况都是可能的,而生成你只要保证满足你自己需求就可以了,如果把导入需求和生成需求比做两个集合,那么生成需求通常都是导入需求的子集,这一规律不仅体现在Excel读写库中,也体现在pdf读写库中,目前市面上大部分的pdf库仅支持生成,不支持导入。

 

 

 

上一篇:303. 区域和检索 - 数组不可变 & 304. 二维区域和检索 - 矩阵不可变 -leetcode刷题(C++)


下一篇:软件供应商是网络安全致命弱点?数据显示93%公司因第三方面临安全漏洞