前言
java web的word在线编辑实现过程可以分解为两步:
- 将word转为html
- 将前台修改完的html转为word文档
注:只支持docx文档,即word2007
一、查看docx文件结构
首先将一个docx文档重命名为zip格式的文件,然后双击打开,就可以看到文件结构
其中word目录中存放的是该文档的各种xml文件以及图片资源
二、查看xml内容
这里我们先查看主要的配置文件document.xml,
可以看到document.xml的结构,在body下,所有的内容都在p(段落)中,除开tbl(表格),
<w:p>
<!--段落属性-->
<w:pPr>
<!--段落样式,确定是标题几,与style.xml中的样式对应-->
<w:pStyle w:val="3"/>
<w:bidi w:val="0"/>
<!--段落对齐方式-->
<w:jc w:val="center"/>
<!--块样式-->
<w:rPr>
<!--字体样式:字体、字体大小-->
<w:rFonts w:hint="eastAsia"/>
<w:lang w:val="en-US" w:eastAsia="zh-CN"/>
</w:rPr>
</w:pPr>
<!--块-->
<w:r>
<!--块属性-->
<w:rPr>
<w:rFonts w:hint="eastAsia"/>
<w:lang w:val="en-US" w:eastAsia="zh-CN"/>
</w:rPr>
<!--块内容-->
<w:t>Word文档在线编辑功能说明

本文介绍了使用Java实现在web上编辑docx文档的流程,包括将docx转为html以及将编辑后的html转换回word。通过分析docx文件的zip结构和document.xml内容,探讨了段落、表格的表示以及单位转换,如从document.xml中的数值转换为HTML可识别的单位。
最低0.47元/天 解锁文章
1787





