java实现word(docx)在线编辑(word转html,html转word)——解读document.xml结构

本文介绍了使用Java实现在web上编辑docx文档的流程,包括将docx转为html以及将编辑后的html转换回word。通过分析docx文件的zip结构和document.xml内容,探讨了段落、表格的表示以及单位转换,如从document.xml中的数值转换为HTML可识别的单位。

前言

java web的word在线编辑实现过程可以分解为两步:

  • 将word转为html
  • 将前台修改完的html转为word文档
    注:只支持docx文档,即word2007

一、查看docx文件结构

首先将一个docx文档重命名为zip格式的文件,然后双击打开,就可以看到文件结构
在这里插入图片描述其中word目录中存放的是该文档的各种xml文件以及图片资源

二、查看xml内容

这里我们先查看主要的配置文件document.xml,
在这里插入图片描述可以看到document.xml的结构,在body下,所有的内容都在p(段落)中,除开tbl(表格),

<w:p>
  <!--段落属性-->
  <w:pPr>
    <!--段落样式,确定是标题几,与style.xml中的样式对应-->
    <w:pStyle w:val="3"/>
    <w:bidi w:val="0"/>
    <!--段落对齐方式-->
    <w:jc w:val="center"/>
    <!--块样式-->
    <w:rPr>
      <!--字体样式:字体、字体大小-->
      <w:rFonts w:hint="eastAsia"/>
      <w:lang w:val="en-US" w:eastAsia="zh-CN"/>
    </w:rPr>
  </w:pPr>
  <!--块-->
  <w:r>
    <!--块属性-->
    <w:rPr>
      <w:rFonts w:hint="eastAsia"/>
      <w:lang w:val="en-US" w:eastAsia="zh-CN"/>
    </w:rPr>
    <!--块内容-->
    <w:t>Word文档在线编辑功能说明
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值