最近做了几个很有意思的功能,女朋友公司需要收集北京互联网的信息,第一反应就是爬虫,但是又不太擅长,因此想到了用正则解析转换为JSON格式导出为EXCEL。恰好工作内容也要做一个把数据库中的数据导入导出并发送邮件的定时任务,因此这里详细学习了一下操作excel的一些内容。
现在主流的操作Excel文件的开源工具有很多,用得比较多的就是Apache的POI及JExcelAPI。这里我们用Apache POI。
这里先附上Apache 官方给的例子吧 可以参考下 http://poi.apache.org/spreadsheet/quick-guide.html
一、POI简介
Apache POI是Apache软件基金会提供的100%开源库。大多数中小规模的应用程序开发主要依赖于Apache POI(HSSF+ XSSF)。它支持Excel 库的所有基本功能; 然而,呈现和文本提取是它的主要特点。
二、所需JAR包
这里我们使用的是maven项目,给出POM文件作为参考:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>3.15</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.15</version>
</dependency>