WORD另存为HTML

文档管理系统需要实现WORD能在线预览功能,以前觉得挺难的,经过一番研究发现,WORD自带的另存为可以保存为HTMl文件。于是考虑在每个文件上传时为其生存一份HTMl文件,这样就能实现在线预览功能。主要代码如下

using System;
using System.Collections;
using System.Configuration;
using System.Data;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.HtmlControls;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using Word = Microsoft.Office.Interop.Word;
public partial class test : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{

WordToHtml("d://yijian.doc");
}
/// <summary>
/// word转成html
/// </summary>
/// <param name="wordFileName"></param>
private string WordToHtml(object wordFileName)
{

//在此处放置用户代码以初始化页面
Word.ApplicationClass word = new Word.ApplicationClass();

Type wordType = word.GetType();

Word.Documents docs = word.Documents;

//打开文件
Type docsType = docs.GetType();
Word.Document doc = (Word.Document)docsType.InvokeMember("Open", System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] { wordFileName, true, true });

//转换格式,另存为
Type docType = doc.GetType();

string wordSaveFileName = wordFileName.ToString();

string strSaveFileName = wordSaveFileName.Substring(0, wordSaveFileName.Length - 3) + "html";

object saveFileName = (object)strSaveFileName;

docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML });

docType.InvokeMember("Close", System.Reflection.BindingFlags.InvokeMethod, null, doc, null);

//退出 Word
wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);

return saveFileName.ToString();
}


}
http://www.cnblogs.com/tonysun/archive/2010/07/09/1774584.html

【核心代码】 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 using Aspose.Cells; using Aspose.Slides.Pptx; using System; using System.Collections.Generic; using System.Data; using System.IO; using System.Linq; using System.Net; using System.Net.Http; using System.Text; using System.Web.Http; namespace DocOnlineView.UI.Controllers.MVCAPI { public class HomeController : ApiController { [HttpGet] public DataTable CourseViewOnLine(string fileName) { DataTable dtlist = new DataTable(); dtlist.Columns.Add("TempDocHtml", typeof(string)); string fileDire = "/Files"; string sourceDoc = Path.Combine(fileDire, fileName); string saveDoc = ""; string docExtendName = System.IO.Path.GetExtension(sourceDoc).ToLower(); bool result = false; if (docExtendName == ".pdf") { //pdf模板文件 string tempFile = Path.Combine(fileDire, "temppdf.html"); saveDoc = Path.Combine(fileDire, "viewFiles/onlinepdf.html"); result = PdfToHtml( sourceDoc, System.Web.HttpContext.Current.Server.MapPath(tempFile), System.Web.HttpContext.Current.Server.MapPath(saveDoc)); } else { saveDoc = Path.Combine(fileDire, "viewFiles/onlineview.html"); result = OfficeDocumentToHtml( System.Web.HttpContext.Current.Server.MapPath(sourceDoc), System.Web.HttpContext.Current.Server.MapPath(saveDoc)); }
HTML文件转换为Word文档格式可以通过多种方法实现,包括使用Java编程、Apache POI库、以及Microsoft Word的内置功能等。以下是一些常见的解决方案。 ### 使用Java和Apache POI库 Apache POI是一个强大的Java库,用于处理Microsoft Office文档,包括Word文档(.doc和.docx)。虽然POI本身不直接支持HTMLWord的转换,但可以通过一些中间步骤实现这一目标。 #### 示例代码:使用POI将HTML内容转换为Word文档 ```java import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.converter.PicturesManager; import org.apache.poi.hwpf.converter.WordToHtmlConverter; import org.apache.poi.hwpf.usermodel.Paragraph; import org.apache.poi.hwpf.usermodel.Range; import org.apache.poi.hwpf.usermodel.Table; import org.apache.poi.hwpf.usermodel.TableCell; import org.apache.poi.hwpf.usermodel.TableRow; import org.w3c.dom.Document; import org.xml.sax.InputSource; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.OutputKeys; import javax.xml.transform.Transformer; import javax.xml.transform.TransformerFactory; import javax.xml.transform.dom.DOMSource; import javax.xml.transform.stream.StreamResult; import java.io.ByteArrayInputStream; import java.io.FileOutputStream; import java.io.StringWriter; public class HtmlToWord { public static void main(String[] args) throws Exception { // 创建一个新的Word文档 HWPFDocument doc = new HWPFDocument(); // 获取文档的范围 Range range = doc.getRange(); // 插入HTML内容 String htmlContent = "<p>这是一个HTML段落。</p>"; range.insertBefore(htmlContent); // 保存为Word文档 try (FileOutputStream out = new FileOutputStream("output.doc")) { doc.write(out); } // 关闭文档 doc.close(); } } ``` 这段代码展示了如何创建一个新的Word文档并将HTML内容插入其中。需要注意的是,POI的HWPF模块主要用于处理.doc格式的文档,而XWPF模块则用于处理.docx格式的文档。对于更复杂的HTML内容,可能需要使用额外的库来解析HTML并将其转换为Word文档的格式。 ### 使用Microsoft Word内置功能 如果你不想使用编程的方式,Microsoft Word提供了直接将HTML文件转换为Word文档的功能。 #### 步骤如下: 1. 打开Microsoft Word。 2. 点击“文件”菜单,选择“打开”。 3. 浏览到你的HTML文件,选择并打开它。 4. Word会自动加载HTML文件的内容。 5. 点击“文件”菜单,选择“另存为”。 6. 在“另存为”对话框中,选择你想要的Word文档格式(如.doc或.docx),然后点击“保存”。 ### 使用在线工具 除了编程和手动转换外,还可以使用一些在线工具来将HTML文件转换为Word文档。这些工具通常提供简单的上传和下载功能,适合那些不需要编程解决方案的用户。 ### 使用Python和PyWin32库(适用于Windows) 如果你使用的是Windows操作系统,可以使用Python的`pywin32`库来调用Word应用程序,从而将HTML文件转换为Word文档。 #### 示例代码:使用Python和PyWin32将HTML文件转换为Word文档 ```python import win32com.client # 创建Word应用程序对象 word = win32com.client.Dispatch("Word.Application") word.Visible = False # 打开HTML文件 doc = word.Documents.Open("input.html") # 保存为Word文档 doc.SaveAs("output.docx", FileFormat=16) # 16表示.docx格式 # 关闭文档Word应用程序 doc.Close() word.Quit() ``` 这段代码展示了如何使用Python和`pywin32`库来调用Word应用程序,并将HTML文件转换为Word文档。需要注意的是,这种方法仅适用于Windows操作系统,并且需要安装Microsoft Word。 ### 总结 以上几种方法都可以用来将HTML文件转换为Word文档格式。选择哪种方法取决于你的具体需求和技术背景。如果你熟悉编程,使用Java或Python可能是最灵活的选择;如果不熟悉编程,使用Microsoft Word的内置功能或在线工具可能更为简便。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值