[原创] Aspose Words Word 转 TXT

用 aspose words 把 Docx/Doc 转换为 TXT, 并保留表格格式

Java

import com.aspose.words.Document;
import com.aspose.words.TxtSaveOptions;

import java.io.File;
import java.nio.file.Paths;
//import java.nio.file.Path;
import java.io.FileOutputStream;

public class Pdf2Txt {
    public static void main(String[] args)throws Exception {
        String input_path = args[0];
        String output_dir = args[1];
        txt(input_path, output_dir);

    private static void txt(String input_path, String output_dir)throws Exception {
        TxtSaveOptions txtSaveOptions = new TxtSaveOptions();
        String input_name = Paths.get(input_path).getFileName().toString();
        // System.out.println("inputfilename: " + input_name);
        String output_path = Paths.get(output_dir).resolve(input_name).toString() + ".txt";
        System.out.println("output: " + output_path);

        txtSaveOptions.setParagraphBreak("\n"); // 设置换行符
        //txtSaveOptions.setExportGeneratorName(false);
        txtSaveOptions.setPreserveTableLayout(true); //保留表格风格
        txtSaveOptions.setPrettyFormat(true); // 格式化
        txtSaveOptions.setUseHighQualityRendering(true); //高质量渲染

        Document doc = new Document(input_path);
        doc.save(output_path, txtSaveOptions);
    }
}

Python

  • 安装
pip install aspose-words
  • 代码
import sys
import os.path
import aspose.words as aw

op = aw.saving.TxtSaveOptions()
op.export_generator_name = False
op.paragraph_break = '\n'
op.preserve_table_layout = True
op.pretty_format = True
op.use_high_quality_rendering = True

doc = aw.Document(sys.argv[0])
filename = os.path.basename(sys.argv[0])
doc.save(os.path.join(sys.argv[1], filename) + '.txt', op)
### 使用Java Aspose.Words API将Word文档转换为图片 为了实现这一目标,可以利用`Aspose.Words for Java`的强大功能来加载Word文档并将其保存为所需的图像格式。以下是具体方法: #### 加载Word文档 首先创建一个`Document`类的对象实例,并通过指定路径加载现有的Word文件。 ```java import com.aspose.words.*; public class ConvertDocToImage { public static void main(String[] args) throws Exception { Document doc = new Document("path/to/input.docx"); ``` #### 设置页面范围和分辨率 定义要渲染的具体页码以及输出图像的质量参数。这一步骤对于控制最终生成图像的效果至关重要[^1]。 ```java int startPageNumber = 1; // 开始页数 int endPageNumber = doc.getPageCount(); // 结束页数,默认设置为总页数 float resolution = 300f; // 输出图像的DPI分辨率为300像素每英寸 ``` #### 创建SaveOptions对象 根据所需的目标图像格式(如JPEG, PNG等),配置相应的保存选项。这里以PNG为例说明。 ```java ImageSaveOptions saveOptions = new ImageSaveOptions(SaveFormat.PNG); saveOptions.setResolution(resolution); // 应用之前设定好的分辨率值 // 如果只导出特定几页,则还需额外指明起止页码 if (startPageNumber != 1 || endPageNumber != doc.getPageCount()) { saveOptions.setPageSet(new PageSet(startPageNumber, endPageNumber)); } ``` #### 执行转换过程 最后调用`Document.save()`函数完成实际的数据流写入工作,从而得到对应的静态图形式样。 ```java doc.save("output.png", saveOptions); System.out.println("Conversion completed successfully."); ``` 以上就是完整的基于Java编程语言环境下的Word图片流程介绍[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值