C#操作PDF文档--PDFBox读取pdf文档,O2S.Components.PDFRender4NET生成缩略图

本文介绍了如何使用C#结合PDFBox库读取PDF文档内容,并利用O2S.Components.PDFRender4NET库生成PDF文档的缩略图。详细步骤包括下载PDFBox,引用所需DLL,以及展示具体的API使用代码示例。

一、下载PDFBox

      访问网址http://sourceforge.net/projects/pdfbox/ 


二、引用动态链接库

    解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
    IKVM.GNU.Classpath.dll
    PDFBox-0.7.3.dll
    FontBox-0.1.0-dev.dll
    IKVM.Runtime.dll


将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
    using org.pdfbox.pdmodel;
    using org.pdfbox.util;

三、API的使用方法

using System.IO;

using System.Text;

using org.pdfbox.pdmodel;

using org.pdfbox.util;

 

namespace PDFReader

{

    class Program

    {

 

        public static void pdf2txt(FileInfo pdffile, FileInfo txtfile)

        {

 

            PDDocument doc = PDDocument.load(pdffile.FullName);

 

            PDFTextStripper pdfStripper = new PDFTextStripper();

 

            string text = pdfStripper.getText(doc);

 

            StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));

 

            swPdfChange.Write(text);

 

            swPdfChange.Close();

 

        }

 

        static void Main(string[] args)

        {

            pdf2txt(new FileInfo(@"D:\1.pdf"), new FileInfo(@"D:\1.txt"));

        }

    }

}

二、运用O2S.Components.PDFRender4NET.dll对PDF文档生成缩略图

代码如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Windows.Forms;
using O2S.Components.PDFRender4NET;
using System.Drawing;
using System.Drawing.Imaging;
using System.IO;


namespace O2S.Components.PDFRender4NET.pdf2image
{
    public static class Program
    {
        public enum Definition
        {
            One = 1, Two = 2, Three = 3, Four = 4, Five = 5, Six = 6, Seven = 7, Eight = 8, Nine = 9, Ten = 10
        }


        /// <summary>
        /// 将PDF文档转换为图片的方法
        /// </summary>
        /// <param name="pdfInputPath">PDF文件路径</param>
        /// <param name="imageOutputPath">图片输出路径</param>
        /// <param name="imageName">生成图片的名字</param>
        /// <param name="startPageNum">从PDF文档的第几页开始转换</param>
        /// <param name="endPageNum">从PDF文档的第几页开始停止转换</param>
        /// <param name="imageFormat">设置所需图片格式</param>
        /// <param name="definition">设置图片的清晰度,数字越大越清晰</param>
        public static void ConvertPDF2Image(string pdfInputPath, string imageOutputPath,
            string imageName, int startPageNum, int endPageNum, ImageFormat imageFormat, Definition definition)
        {
            PDFFile pdfFile = PDFFile.Open(pdfInputPath);


            if (!Directory.Exists(imageOutputPath))
            {
                Directory.CreateDirectory(imageOutputPath);
            }


            // validate pageNum
            if (startPageNum <= 0)
            {
                startPageNum = 1;
            }


            if (endPageNum > pdfFile.PageCount)
            {
                endPageNum = pdfFile.PageCount;
            }


            if (startPageNum > endPageNum)
            {
                int tempPageNum = startPageNum;
                startPageNum = endPageNum;
                endPageNum = startPageNum;
            }


            // start to convert each page
            for (int i = startPageNum; i <= endPageNum; i++)
            {
                Bitmap pageImage = pdfFile.GetPageImage(i - 1, 56 * (int)definition);
                pageImage.Save(imageOutputPath + imageName + i.ToString() + "." + imageFormat.ToString(), imageFormat);
                pageImage.Dispose();
            }


            pdfFile.Dispose();
        }


        public static void Main(string[] args)
        {
            ConvertPDF2Image("D:\\1.pdf", "D:\\", "A", 1, 5, ImageFormat.Jpeg, Definition.One);
        }


    }
}


本文主要参考:http://blog.youkuaiyun.com/shi0090/article/details/7262199

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值