C#读取Word文件的方法

本文介绍了使用C#通过Microsoft.Office.Interop.Word库读取Word文件的步骤,包括添加引用、操作Word应用程序,以及读取文档内容的方法,如打开文档、读取段落、获取段落数量和关闭文档。还提到了如何处理网页拷贝的目录换行符问题,并指出通过调整代码可以读取句子或整个文档内容。最后,作者提到为了支持多种格式的抽取,采用抽象类的设计方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第1步:
对项目添加引用
Microsoft Word 11.0 Object Library

第2步:
在程序中添加
using Word = Microsoft.Office.Interop.Word;

第3步:
程序中添加
Word.Application app = new Microsoft.Office.Interop.Word.Application(); //可以打开word程序
Word.Document doc = null; //一会要记录word打开的文档
word文档和word程序可不是一回事奥!

第4步:
一般来说,对于抽取word内容,用的方法很少
public override void openFile(object fileName){} //打开文档
public override object readPar(int i){} //读取word文档的第i段
public override int getParCount(){} //返回word文档一共几段
public override void closeFile(){} //关闭文档
public override void quit(){} //关闭word程序
//从网页上拷贝的目录有时候会出现手动换行符^l,,先将其换成回车段落标记,才能正确读取
public void replaceChar(){}

5:代码

public override void openFile(object fileName) 
        { 
            try 
            { 
                if (app.Documents.Count > 0) 
                { 
                    if (M
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值