1.下载PDFBox-0.7.3
2.解压PDFBox,项目中添加存在解压后Bin目录下的dll文件:IKVM.GNU.Classpath.dll、IKVM.Runtime.dll、FontBox-0.1.0-dev.dll、PDFBox-0.7.3.dll
3.文件中引入2个命名空间:using org.pdfbox.pdmodel、using org.pdfbox.util
4.如下代码变可以读取pdf文档:
void ReadPdf(FileInfo pdffile)
{
PDDocument doc = PDDocument.load(pdffile.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
}
此时pdf文档的内容就被读取到字符串text中。