需求:将Excel转化为HTML,支持图片,支持多Sheet。
要求:1. 第三方插件免费开源;2. 支持跨平台
设计方案:
1. 采用Apache POI;
2. 多个Sheet时,下个Sheet内容向下对齐HTML。
3. 图片以文件的形式单独存储,或者以二进制字符串的形式保存在HTML文件中;
开发难点:
1. HTML中图片位置应该和Excel保持一致(图片向下对齐比较简单,但用户体验不好)。
遗留问题(后续改进中):
1. HTML图片左边距和Excel接近,但是有些情况下上边距和Excel有明显区别,还需优化。
代码逻辑:
1. 使用POI将Excel文本转化为HTML字符串(包含样式,但是没有图片)。
2. 使用POI获取Excel中所有图片的信息,包括图片所在Sheet索引、行号、列号、单元格内的上边距、单元格内的左边距、二进制流等。
3. 根据图片信息,生成图片对应的HTML字符串(一张图片独占一个table);过程中需要计算图片在HTML中的左边距和上边距。
4. 解析文本HTML字符串,将图片HTML信息放在body的尾部,组合成完整的HTML字符串。
5. 生成HTML文件。
Excel(含2个Sheet):
Excel转化后的HTML:
maven(部分):
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-io</artifactId>
<version>1.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<version>3.9</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>4.1.0</version>
</dependency>
代码 - 以下代码针对excel2003(xls)的操作, excel2007(xlsx)需要单独处理。
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.Base64;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.UUID;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.apach