利用JAVA操作EXCEL文件
2024年03月06日
使用Windows操作系统的朋友对Excel(电子表格)一定不会陌生,但是要使用Java语言来整理Excel文件并不是一件容易的事。在Web应用迫切盛行的今天,通过Web来操作Excel文件的需求越来越强烈,目前比较流行的操作是在JSP或Servlet中创建一个CSV(逗号分隔值)文件,把这个文件以MIME,text/csv类型返回给浏览器,然后浏览器调用Excel和CSV显示文件。这样只是说可以访问Excel文件,但是还不能真正的整理Excel文件,本文将给大家一个惊喜,向大家介绍一个开放源码项目,Java Excel API,使用它就方便大家可以地JAVA EXCEL API简介Java
Excel是一个源码开放项目,通过它Java开发人员可以读取Excel文件的内容、创建新的Excel文件、更新已经存在的Excel文件。使用该API非Windows网络也可以通过纯Java应用来处理Excel数据表。因为是使用Java编写的,所以我们在Web应用中可以通过JSP、Servlet来调用API实现对Excel数据表的访问。现在发布的稳定版本是
V2.0,提供以下功能:
从Excel 95、97、2000等格式的文件中读取数据;
读取Excel公式(可以读取Excel 97以后的公式);
生成Excel数据表(格式为Excel 97);
支持字体、数字、日期的格式化;
支持单元格的亮度操作,以及颜色操作;
修改已经存在的数据表;
现在支持不以下功能,但很快就会提供:
不能够读取图表信息;
可以读取,但是无法生成公式,任何类型公式最后的计算值都可以读取;
应用示例
1从Excel文件读取数据表
Java Excel API既可以从本地文件系统的一个文件(.xls),也可以从输入流中读取读取Excel数据表的第一步是创建Workbook(术语:工作薄),下面的代码片段说明了应该如何操作:(完整代码见ExcelReading.java)
import java.io.*;
导入jxl.*;
…………
try
{
//构建Workbook对象,表单Workbook对象
//直接从本地文件创建Workbook
//从输入流创建Workbook
InputStream is=new FileInputStream(sourcefile);
jxl.Workbook rwb=Workbook.getWorkbook(is);
}
catch(Exception e)
{
e.printStackTrace();
}
一旦创建了Workbook,我们就可以通过它来访问Excel Sheet(术语:工作表)。参考下面的代码片段:
//获取第一张SheetTableSheet
rs=rwb.getSheet(0);
我们既可以通过Sheet的名称来访问它,也可以通过下标来访问它。如果通过下标来访问的话,要注意的一点是下标从0开始,就像数据库一样。一旦拿到了
Sheet,我们就可以通过它来访问Excel Cell(术语:单元格)。参考下面的代码片段:
//获取第一行,第一列的值
Cell c00=rs.getCell(0,0);
字符串strc00=c00.getContents();
//获取第一行,第二列的值
Cell c10=rs.getCell(1,0);
字符串strc10=c10.getContents();
//获取第二行,第二列的值
Cell c11=rs.getCell(1,1);
字符串strc11=c11.getContents();
System.out.println("Cell(0,0)"+"值:"+strc00+";类型:"+c00.getType());
System.out.println("Cell(1,0)"+"值:"+strc10+";类型:"+c10.getType());
System.out.println("Cell(1,1)"+"value:"+strc11+";type:"+c11.getType());
如果获取Cell的值,我们其实可以方便地通过getContents()方法,它可以将任何类型的Cell值都作为一个字符串返回。示例代码中Cell(0,0)是文本类型,Cell(1,0)是数字类型,Cell(1,1)是日期类型,通过getContents(),透明类型的返回值都是字符型。
如果有需要知道Cell内容的目的类型,API也提供了一系列的方法。参考下面的代码片段:
String strc00=null;
双strc10=0.00;
日期strc11=null;
单元格c00=rs.getCell(0,0);
单元格c10=rs.getCell(1,0);
单元格c11=rs.getCell(1,1);
if(c00.getType()==CellType.LABEL)
{
LabelCell labelc00=(LabelCell)c00;
strc00=labelc00.getString();
}
if(c10.getType()==CellType.NUMBER)
{
NmberCell numc10=(NumberCell)c10;
strc10=numc10.getValue();
}
if(c11.getType()==CellType.DATE)
{
DateCell datec11=(DateCell)c11;
strc11=datec11.getDate();
System.out.println
("Cell(0,0)"+"值:"+strc00+";类型:"+c00.getType());
System.out.println("Cell(1,0)"+"值:"+strc10+";类型:"+c10.getType());
System.out.println("Cell(1,1)"+"value:"+strc11+";type:"+c11.getType());
在获得Cell对象后,通过getType()方法可以获得该单元类型的类型,然后与API提供的基本类型相匹配,强制转换成相应的类型,最后调用相应的取值方法getXXX(),就可以得到确定类型的值。API提供了以下基本类型,与Excel的数据格式相对应,如下图所示:
端点类型的具体含义,请参阅Java Excel API文档。
当你完成对Excel电子表格数据的处理后,一定要使用close()方法来关闭先前创建的对象,以释放读取完成数据表的过程中所占用的内存空间,在读取大量数据时缩小极为重要。参考如下代码片段:
//操作时,关闭对象,释放占用的内存空间
rwb.close();
Java Excel API提供了许多访问Excel数据表的方法,这里我只是简单地介绍几个常用的方法,其他的方法请参考附录中的Java Excel API文档。
Workbook类提供的方法
1.int getNumberOfSheets()
获取工作薄(Workbook)中工作表(Sheet)的个数,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
int Sheets=rwb.getNumberOfSheets();
2.Sheet[]getSheets()
返回工作薄(Workbook)中工作表(Sheet)对象备份,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
Sheet[]Sheets=rwb.getSheets();
3.String getVersion()
返回正在使用的API的版本号,看起来是一个简单的作用。
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
String apiVersion=rwb.getVersion();
Sheet接口提供的方法
1)String getName()
获取Sheet的名称,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs=rwb.getSheet(0);
字符串sheetName=rs.getName();
2)int getColumns()
获取Sheet表中所包含的总列数,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs=rwb.getSheet(0);
int rsColumns=rs.getColumns();
3)Cell[]getColumn(int column)
获取该列的所有单元格,返回是单元格对象仓库,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs=rwb.getSheet(0);
Cell[]cell=rs.getColumn(0);
4)int getRows()
获取Sheet表中所包含的总行数,示例:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs=rwb.getSheet(0);
int rsRows=rs.getRows();
5)Cell[]getRow(int row)
获取每个行的所有单元格,返回的是单元格对象数组,示例子:
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs=rwb.getSheet(0);
Cell[]cell=rs.getRow(0);
6)Cell getCell(int column,int row)
获取指定单元格的对象引用,需要注意的是它的两个参数,第一个是列数,第二个是行数,这与通常的行、列
jxl.Workbook rwb=jxl.Workbook.getWorkbook(new File(sourcefile));组合有些不同。
jxl.Sheet rs=rwb.getSheet(0);
单元格=rs.getCell(0,0);
2生成新的Excel工作表
下面的代码主要是向大家介绍如何生成简单的Excel工作表,这里单元格的内容是不带任何修饰的(如:字体,颜色等),所有的内容都作为(完整代码见ExcelWriting.java)
与读取Excel工作表相似,首先要使用Workbook类的工厂方法创建一个可写入的工作表(Workbook)对象,这里要注意的是,只能通过API提供的工厂方法来创建Workbook,而不能使用WritableWorkbook的构造函数,因为类WritableWorkbook的构造函数为protected类型。示例代码片段如下:
import java.io.*;
导入jxl.*;
导入jxl.write.*;
…………
try
{
//构建Workbook对象,表单Workbook对象
//方法1:创建可写入的Excel工作薄
jxl.write.WritableWorkbook wwb=Workbook.createWorkbook(new File(targetfile));
//方法2:将WritableWorkbook直接写入到输出流
/*
OutputStream os=new FileOutputStream(targetfile);
jxl.write.WritableWorkbook wwb=Workbook.createWorkbook(os);
*/
}
catch(Exception e)
{
e.printStackTrace();API提供了两种方式来处理可读取的输出流,一种是直接生成本地文件,如果文件名不带全路径的话,那么的文件会定位在当前目录,如果文件名带有全
路径
然后,则生成的Excel文件定位在相应的目录;另外一个Excel对象直接写入到输出流,例如:用户通过浏览器来访问Web服务器,如果HTTP头设置正确的话,浏览器自动调用客户端的Excel应用程序,来显示动态生成的Excel电子表格。
接下来就是要创建工作表,创建工作表的方法与创建工作表的方法几乎一样,同样是通过工厂模式方法获取相应的对象,该方法需要两个参数,一个是工作表的名称,另一个是工作表在工作薄中的位置,参考下面的代码片段:
//创建Excel工作表
jxl.write.WritableSheet ws=wwb.createSheet("Test板材1",0);
“这锅也支好了,材料也准备齐全了,可以开始下锅了!”,现在做的只是实例化API所提供的Excel基本数据类型,把它们添加到工作表中就可以了,参考下面的代码片段:
//1.添加Label对象
jxl.write.Label labelC=new jxl.write.Label(0,0,"This is a Label cell");
ws.addCell(labelC);
//添加标记字型格式化的对象
jxl.write.WritableFont wf=new jxl.write.WritableFont(WritableFont.TIMES,18,WritableFont.BOLD,true);
jxl.write.WritableCellFormat wcfF=new jxl.write.WritableCellFormat(wf);
jxl.write.Label labelCF=new jxl.write.Label(1,0,"这是一个标签单元格",wcfF);
ws.addCell(labelCF);
//添加标记字体颜色Formatting的对象
jxl.write.WritableFont wfc=new jxl.write.WritableFont(WritableFont.ARIAL,10,WritableFont.NO_BOLD,false,
UnderlineStyle.NO_UNDERLINE,jxl.format.Colour.RED);
jxl.write.WritableCellFormat wcfFC=new jxl.write.WritableCellFormat(wfc);
jxl.write.Label labelCFC=new jxl.write.Label(1,0,"这是一个标签单元格",wcfFC);
ws.addCell(labelCF);
//2.添加Number对象
jxl.write.Number labelN=new jxl.write.Number(0,1,3.1415926);
ws.addCell(labelN);
//添加带有格式化的Number对象
jxl.write.NumberFormat nf=new jxl.write.NumberFormat("#.##");
jxl.write.WritableCellFormat wcfN=new jxl.write.WritableCellFormat(nf);
jxl.write.Number labelNF=new jxl.write.Number(1,1,3.1415926,wcfN);
ws.addCell(labelNF);
//3.添加Boolean对象
jxl.write.Boolean labelB=new jxl.write.Boolean(0,2,false);
ws.addCell(labelB);
//4.添加DateTime对象
jxl.write.DateTime labelDT=new jxl.write.DateTime(0,3,new java.util.Date());
ws.addCell(labelDT);
//添加带格式化的DateFormat对象
jxl.write.DateFormat df=new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");
jxl.write.WritableCellFormat wcfDF=new jxl.write.WritableCellFormat(df);
jxl.write.DateTime labelDTF=new jxl.write.DateTime(1,3,new java.util.Date(),wcfDF);
ws.addCell(labelDTF);
这里有两点要引起大家的注意。第一点,在构造单元格的时候,单元格在工作表中的位置就已经确定了。一旦创建后,单元格的位置是不能够变更的,虽然单元格的内容是可以改变的。第二个点,单元格的定位是按照下面这样的规律(列,行),而且下标都是从0开始,例如,A1被存储在(0,0),B1被存储在(1,0)。
最后,不要忘记关闭打开的Excel工作薄对象,以释放占用的内存,下面的代码片段:
//写入Exel工作表
wwb.write();
//关闭Excel工作薄对象
wwb.close();
这可能与读取Excel文件的操作有少少不同,在关闭Excel对象之前,你必须先调用write()方法,因为前面的操作存储都在存储中的,所以要通过该方法将操作的内容保存在文件中。如果你先关闭了Excel对象,那么只能得到一张空的工作薄了。
3个拷贝、更新Excel工作薄
接下来简要介绍一下如何更新一个已经存在的工作薄,主要是下面第二步操作,第一步是构造有关的Excel工作薄,第二步是利用已经创建的Excel工作薄创建新的可写入的Excel工作薄,参考下面的代码片段:(完整代码见ExcelModifying.java)
//创建套接字的Excel工作薄的对象
jxl.Workbook rw=jxl.Workbook.getWorkbook(new File(sourcefile));
//创建可写入的Excel工作薄对象
jxl.write.WritableWorkbook wwb=Workbook.createWorkbook(new File(targetfile),rw);
//读取第一张工作表
jxl.write.WritableSheet ws=wwb.getSheet(0);
//获得第一个单元格对象
jxl.write.WritableCell wc=ws.getWritableCell(0,0);
//判断单元格的类型,做出相应的转化
if(wc.getType()==CellType.LABEL)
{
Label l=(Label)wc;
l.setString("该值已被修改。");
}
//写入Excel对象
wwb.write();
//关闭可写入的Excel对象
wwb.close();
//关闭方便的Excel对象
rw.close();
此时使用这种方式构建Excel对象,完全是因为效率的原因,因为上面的例子才是API的主要应用。为了提高性能,在读取工作此时,与数据相关的一些输出信息,所有的格式信息,如:字体、颜色等等,是不被处理的,因为我们的目的是获得行数据的值,既不使用修饰,也不会对行数据的值产生什么影响。唯一的不利点就是,在内存中会同时保存两个相同的工作表,这样当工作表体积比较大的时候,会占用相当大的内存,但现在看起来内存的大小不是关键因素了。
一旦获得了可读取的工作表对象,我们就可以对单元格对象进行更新的操作了,这里我们不一定要调用API提供的add()方法,因为单元格已经位于工作表指出,所以我们只需要调用相应的setXXX()方法,就可以完成更新的操作了。
尽单元格原有的修饰修饰是不能去掉的,我们还是可以将新的单元格修饰加上去,
新生成的工作表对象是可写入的,我们除了更新原有的单元格,还可以添加新的单元格到工作表中,这与示例2的操作是完全一样的。
最后,不要忘记调用write()方法,将更新的内容写入到文件中,然后关闭工作薄对象,这里有两个工作薄对象要关闭,一个是无意的,另外一个是可写入的。
小结
本文只是对Java Excel API中常用的方法作了介绍,女儿更精彩地了解API,请大家参考API文档,或来源代码。Java Excel API是一个开放项目源码,请大家关注它的最新进展,有兴趣的朋友也可以申请加入这个项目,或者是获得宝贵的意见。