使用Jacob将Word转为Html或txt

本文介绍了一种使用Java和Jacob库将Microsoft Word文档(.doc)批量转换为HTML的方法。通过递归处理指定目录下的所有Word文件,实现文档格式转换,并将结果保存在同一目录下。该方法适用于需要将大量Word文档转换为网页格式的应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本博客 jacob 列文章导读
Java操作Microsoft Word之jacob
jacob使用入门及问题解析
使用Jacob将Word转为Html或txt
使用Jacob将Word转为PDF
java通过jacob调用word (根据Word模板生成动态内容)

//------------------------------------------------------------------------------   //版权所有 (C) 浪潮集团商用系统有限公司 保留所有权利   //文件名称: wordtohtml 文件版本: 1.00.00   //作 者: 郭铸 作者邮箱: guozhu@langchao.com 完成日期: 2004-10-20   //文件描述:   //其它描述:   //类 列 表:   // wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下   //修改历史:   // # 版本 修改日期 作者 修改内容   // ----------------------------------------------------------------------------   // 1 1.00.01 2004-10-14 作者姓名 修改内容描述   // ----------------------------------------------------------------------------   //------------------------------------------------------------------------------   import com.jacob.com.*;   import com.jacob.activeX.*;   import java.io.*;   //取得指定目录下面所有的doc文件名称   public class wordtohtml   {   //------------------------------------------------------------------------------   //方法原型: change(String paths)   //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下   //输入参数: String   //输出参数: 无   //返 回 值: 无   //其它说明: 递归   //------------------------------------------------------------------------------   public static void change(String paths, String savepaths)   {      File d = new File(paths);   //取得当前文件夹下所有文件和目录的列表   File lists[] = d.listFiles();   String pathss = new String("");   //对当前目录下面所有文件进行检索   for(int i = 0; i < lists.length; i ++)   {   if(lists[i].isFile())   {   String filename = lists[i].getName();   String filetype = new String("");   //取得文件类型   filetype = filename.substring((filename.length() - 3), filename.length());      //判断是否为doc文件   if(filetype.equals("doc"))   {   System.out.println("当前正在转换......");   //打印当前目录路径   System.out.println(paths);   //打印doc文件名   System.out.println(filename.substring(0, (filename.length() - 4)));      ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word      String docpath = paths + filename;   String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));      String inFile = docpath;   //要转换的word文件   String tpFile = htmlpath;   //HTML文件   boolean flag = false;      try   {   app.setProperty("Visible", new Variant(false));   //设置word不可见 Object docs = app.getProperty("Documents").toDispatch();   Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();   //打开word文件   Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);   //作为html格式保存到临时文件   Variant f = new Variant(false);   Dispatch.call(doc, "Close", f);   flag = true;   }   catch (Exception e)   {   e.printStackTrace();   }   finally   {   app.invoke("Quit", new Variant[] {});   }   System.out.println("转化完毕!");   }   }   else   {   pathss = paths;   //进入下一级目录   pathss = pathss + lists[i].getName() + "//";   //递归遍历所有目录   change(pathss, savepaths);   }   }      }   //------------------------------------------------------------------------------   //方法原型: main(String[] args)   //功能描述: main文件   //输入参数: 无   //输出参数: 无   //返 回 值: 无   //其它说明: 无   //------------------------------------------------------------------------------   public static void main(String[] args)   {      String paths = new String("D://Work//2004.10.8//test system//test01//word//");   String savepaths = new String ("D://Work//2004.10.8//test system//test01//html//");   change(paths, savepaths);   } }

博文来源:http://blog.youkuaiyun.com/hcx_2008/archive/2007/09/11/1781375.aspx

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值