Free Spire.Doc组件C# 读取Word文档中的文本内容

本文介绍使用C#和Free Spire.Doc组件读取Word文档文本内容的两种方法,一是直接获取所有文本,二是遍历段落获取文本。第一种简便,第二种灵活。还指出该控件非免费,有诸多限制,可下载破解版dll,文中给出下载地址。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

C# 读取Word文档中的文本内容

这篇文章将介绍如何使用C#和Free Spire.Doc组件读取Word文档中的文本内容。Free Spire.Doc提供了两种方法来读取Word文档中的内容,一种是直接获取文档中的所有文本内容,另一种是遍历文档中的节和其中的段落,然后获取段落中的文本,下面将逐一介绍这两种方法。

Word文档截图:

在使用以下代码前,需要先在Visual studio中创建一个C#应用程序,然后引用Spire.Doc.dll到程序中。

方法一 直接获取所有文本

//加载Word文档
Document doc = new Document();
doc.LoadFromFile("Input.docx");
 
//使用GetText方法获取文档中的所有文本
string s = doc.GetText();
 
File.WriteAllText("文本1.txt", s.ToString());
效果图:


方法二 遍历段落获取文本

//加载Word文档
Document document = new Document();
document.LoadFromFile(@"测试文档.docx");
 
StringBuilder sb = new StringBuilder();
 
//遍历节和段落,获取段落中的文本
foreach (Section section in document.Sections)
{
    foreach (Paragraph paragraph insection.Paragraphs)
    {
        sb.AppendLine(paragraph.Text);
    }
}
 
File.WriteAllText("文本2.txt",sb.ToString());
效果图:


总结

这两种方法结果都差不多,第一种方法更简便,通过一个方法可以一次性获取文档中的内容,但第二种方法更灵活,可以获取到文档中指定节或指定段落中的文本,可以根据自己的需要选择相应的方法。

原来直接引用了Eiceblue的文章,经过自己测试。这个控件并非免费使用,有很多的限制。比如,转格式超过10页就会报错,功能已经限制死了,只能转10页的内容。因此,需要下载破解版本的dll。在csdn上找了下,有破解版本的dll,亲测可以用。下载地址:https://download.youkuaiyun.com/download/tom_8899/10832247

前面内容引用自 https://blog.youkuaiyun.com/Eiceblue/article/details/79932491 

Free Spire.Doc 是一款免费的专门对 Word 文档进行操作的 .NET类库。适用于商业或个人用途。这款控件的主要功能在于帮助开发人员轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。作为一款独立的 Word .NET 控件,能执行多种 Microsoft Word 文档处理任务的 .NET API。支持 Word97-2003,Word2007,Word2010 以及 Word2013。能在 Word 97/2003/2007/2010/2013 和 XML、RTF、TXT、XPS、EPUB、EMF、HTML 等格式文件之间进行双向转换,还能将 Word 文件高质量地转换为 PDF 文件格式。 主要功能如下: 1. 高质量的文档转换。Free Spire.Doc for .NET 能帮助用户将 Word 文件保存在流中,也可以保存为 Web response,还支持将 Word 文件与 XML、RTF、EMF、 TXT、XPS、EPUB、HTML 等格式文件之间的双向转换。同时,它还支持将 Word 文件转换为 PDF 文件,HTML 文件转换为图像文件。 2. 多样化的 Word 文档功能。支持动态创建一个全新的 Word 文档,并支持几乎所有的 Word 文档元素,它们主要包括页面、节、页眉、页脚、脚注、尾注、段落、项目符号和编号、表格、 文本、域、超链接、书签、注释、图片、样式、背景设置、打印功能、文档设置和文档保护。同时,也支持形状、文本框、图片、OLE 对象和内容控件。 3. 对已有的 Word 文档进行操作处理。支持搜索和替换、设置对齐方式、分页、分节、填充域、文档合并、复制、打印以及邮件合并等。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值