今天为了整理一个Excel文件,内容比较多,好几千行,一条一条来处理要死要死,所以搜了有关java对Excel的一些操作,写了一个小程序来处理Excel,分享出来给大家,也欢迎大家提出改进意见。
操作Excel主要用到了jExcelAPI,在 http://sourceforge.net/projects/jexcelapi/files/jexcelapi/2.6.6/jexcelapi_2_6_6.zip/download 这里可以下载到jar包。还包含了doc方便查阅。
原始数据是这样的,第1列是queryName,第3列是难易度,第5列开始是http:地址。要求是把http:地址每行只放一条。
name1 | 难 | http1 | http2 | http3 | |||
name2 | http4 | http5 | |||||
name3 |
处理后的数据是这样的:
name1 | 难 | http1 | ||
http2 | ||||
http3 | ||||
name2 | http4 | |||
http5 | ||||
name3 |
好了,直接上代码,代码里的注释比较详细了。记得导入jxl.jar这个包。好多类的用法我也没搞太清楚,按实际情况边学边改就行,doc还是挺详细的。
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.ArrayList;
import jxl.Cell;
import jxl.CellType;
import jxl.Sheet;
import jxl.Workbook;
import jxl.write.Label;
import jxl.write.WritableSheet;
public class ReadExcel {
public static void main(String[] args)
{
ArrayList<String> httpList = new ArrayList<String>(); //存放那些http://地址的字符串
ArrayList<String> nameList = new ArrayList<String>(); //存放query名
ArrayList<String> charList = new ArrayList<String>(); //存放那个难字
jxl.Workbook readwb = null;
try
{
// 构建Workbook对象, 只读Workbook对象
// 直接从本地文件创建Workbook
InputStream instream = new FileInputStream("H:/textexcel2.xls");
readwb = Workbook.getWorkbook(instream);
// Sheet的下标是从0开始
// 获取第一张Sheet表
Sheet readsheet = readwb.getSheet(0);
// 获取Sheet表中所包含的总列数
int rsColumns = readsheet.getColumns();
// 获取Sheet表中所包含的总行数
int rsRows = readsheet.getRows();
// 获取指定单元格的对象引用
for(int i = 0; i<rsRows;i++){ //这里是获取query的名称
Cell cell = readsheet.getCell(0, i); //query的名称都在第一列,所以获取所有第一列的单元格(程序中单元格下标从0开始,所以第一列就是程序里的第0列)
nameList.add(cell.getContents()); //因为query名不会为空,所以直接将名加入数组
}
for(int i = 0; i<rsRows;i++){ //这是是获取那个难字
Cell cell = readsheet.getCell(2, i); //难字在第三列,所以定位到所有的第三列
if(cell.getType() == CellType.EMPTY){ //没有难字的单元格内容为空,所以遇到这样的单元格,添加一个空格到数组中即可
charList.add(" ");
}
else
charList.add(cell.getContents()); //添加难字到单元格中
}
for(int i = 0; i<rsRows;i++){ //这里是获取http:// 连接的字符串
for(int j=5;j<rsColumns;j++) //http:// 连接在第六列开始,同一行中有数列,所以要两个循环,第一个循环管行,第二个循环管列。
{ //从第六列开始,将遇到的http:// 字符串添加到数组中去。
Cell cell = readsheet.getCell(j, i);
if(j==5 && cell.getType() == CellType.EMPTY){ //有些query可能没有http:// 地址,所以第六列会是空的,所以遇见第六列为空的情况,就添加一个空格到数组中去。
httpList.add(" ");
}
if(cell.getType() != CellType.EMPTY){ //若http:// 内容不为空,添加http:// 代码到数组中。
httpList.add(cell.getContents());
}
}
}
//创建新的可写入的Excel工作薄
jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File("H:/textexcel3.xls"));
//创建工作表
WritableSheet ws = wwb.createSheet("Test Sheet 1",0);
int n = 0;
int k = 0;
for(int i=0;i<httpList.size();i++){ //将数据添加到新的表格中。
Label label = new Label(5,i,httpList.get(i)); //先添加http:// 地址,因为整合后的http:// 地址只有一列,并且他的数量最多,所以先把http:// 地址添加到表中
ws.addCell(label);
String str = httpList.get(i);
if(str.charAt(0) == '1' || str.charAt(0) == ' '){ //然后添加query名,因为query名下的http:// 地址的第一位都带着1. 所以当发现带1的http:// 和空的http:// 时,添加query名到第一行
Label label2 = new Label(0,i,nameList.get(n++));
ws.addCell(label2);
Label label3 = new Label(2,i,charList.get(k++)); //因为query名数组和难字数组长度一样,有难字的query名在数组中的位置与难字在数组中的位置相同,所以直接添加相同位置的难字即可,其他没有难字的位置为空格,就算添加上去也看不出。
ws.addCell(label3);
}
}
//写入Excel对象
wwb.write();
wwb.close(); //最后别忘了关闭workbook,释放资源。
} catch (Exception e) {
e.printStackTrace();
} finally {
readwb.close();
}
}
}