apache poi是解析ms office的比较好用的工具,可以解析excel,word,ppt,visio。我这里讲一个解析excel的比较粗糙的例子
我使用的是apache poi 3.10
引入以下jar包:
poi-3.10-FINAL-20140208.jar
poi-ooxml-3.10-FINAL-20140208.jar
poi-ooxml-schemas-3.10-FINAL-20140208.jar
dom4j-1.6.1.jar
xmlbeans-2.3.0.jar
由于我只用到其中一部分,没必要引用多余的jar包,请根据自己的需求引用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
|
package com.zhou.test; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import org.apache.poi.hssf.usermodel.HSSFCell; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFWorkbook; public class ReadXls { public static void main(String args[]) throws FileNotFoundException,
IOException { //路径 String fileToBeRead = "E:\\aaa.xls" ; // 创建对Excel工作簿文件的引用 HSSFWorkbook workbook = new HSSFWorkbook( new FileInputStream( fileToBeRead)); // 创建对工作表的引用。 // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1") // 也可用getSheetAt(int index)按索引引用, // 在Excel文档中,第一张工作表的缺省索引是0, // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0); HSSFSheet sheet = workbook.getSheet( "Sheet1" ); int rows=sheet.getLastRowNum(); for ( int i= 0 ;i<=rows;i++){ HSSFRow row=sheet.getRow(i); int cells=row.getLastCellNum(); for ( int j= 0 ;j<cells;j++){ HSSFCell cell=row.getCell(j); if (cell!= null ){ if (cell.getCellType()==HSSFCell.CELL_TYPE_STRING){ System.out.print(cell.getStringCellValue()); } else if (cell.getCellType()==HSSFCell.CELL_TYPE_NUMERIC){ System.out.print(cell.getNumericCellValue()); } else if (cell.getCellType()==HSSFCell.CELL_TYPE_BOOLEAN){ System.out.print(cell.getBooleanCellValue()); } } System.out.print( "," ); } System.out.println(); } } } |
上面解析一个aaa.xls的文件,并将内容打印出来,当然,这里打印出来的内容不太准确,
因为单元格类型在api中只提供6种,但是其中并没有日期等。
apache poi也可以解析2007格式的office文档,
操作xlsx相对于xls,api基本是相同的,只是把HSSF都改成XSSF就行。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
|
package com.zhou.test; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import org.apache.poi.xssf.usermodel.XSSFCell; import org.apache.poi.xssf.usermodel.XSSFRow; import org.apache.poi.xssf.usermodel.XSSFSheet; import org.apache.poi.xssf.usermodel.XSSFWorkbook; public class ReadXlsx { public static void main(String[] args) throws FileNotFoundException,
IOException { //路径 String fileToBeRead = "E:\\aaa.xlsx" ; // 创建对Excel工作簿文件的引用 XSSFWorkbook workbook= new XSSFWorkbook( new FileInputStream( fileToBeRead)); // 创建对工作表的引用。 XSSFSheet sheet=workbook.getSheetAt( 0 ); int rows=sheet.getLastRowNum(); for ( int i= 0 ;i<=rows;i++){ XSSFRow row=sheet.getRow(i); int cells=row.getLastCellNum(); for ( int j= 0 ;j<cells;j++){ XSSFCell cell=row.getCell(j); if (cell!= null ){ if (cell.getCellType()==XSSFCell.CELL_TYPE_STRING){ System.out.print(cell.getStringCellValue()); } else if (cell.getCellType()==XSSFCell.CELL_TYPE_NUMERIC){ System.out.print(cell.getNumericCellValue()); } else if (cell.getCellType()==XSSFCell.CELL_TYPE_BOOLEAN){ System.out.print(cell.getBooleanCellValue()); } } System.out.print( "," ); } System.out.println(); } } } |