java实现从url获取PDF内容

这篇博客介绍了如何使用Java结合Apache PDFBox库直接从URL获取PDF内容。作者指出,虽然网上的教程多为PDF转HTML或文本,但直接通过URL获取PDF内容的教程较少,因此分享了自己的实践经验和代码,旨在节省他人的时间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Java直接URL获取PDF内容

题外话

网上很多Java通过pdf转 HTML,转文本的,可是通过URL直接获取PDF内容,缺没有,浪费时间,本人最近工作中刚好用到,花了时间整理下,分享出来,防止浪费时间,Apache的pdfbox 2013年都有了。

import java.io.*;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;



import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;


/**
 * 通过URL获得PDF内容 转存
 * @author sunyang
 * @date 2019/1/24 14:40
 */
public class PdfText2Url {
   
   

    public static void main(String[] args) {
   
   
        try {
   
   
            //需要获取到的PDF地址
    readPdf("https://img1.xxx.org/tech/file/9bd7/733b/7ef54fbf672cfffaf2b1a6c2.pdf")
Java中,为了实现在服务器上获取PDF文件并将其发送给浏览器打印,可以采用以下步骤: 1. **服务端处理**: - 使用Spring Boot 或类似框架创建一个Web服务API,例如RESTful API,该API接收用户的请求。 - 当接收到打印PDF的请求时,使用`java.net.URL`或`javax.ws.rs.client.Client`等库下载PDF文件内容到服务器内存。 ```java import javax.ws.rs.client.Client; import javax.ws.rs.client.ClientBuilder; import java.io.InputStream; public class PdfService { public InputStream downloadPdf(String pdfUrl) { Client client = ClientBuilder.newClient(); WebResource resource = client.resource(pdfUrl); return resource.get(InputStream.class); } } ``` 2. **文件换**: - 如果需要将二进制流换成适合浏览器打印的MIME类型,比如`application/pdf`, 可能需要用到第三方库如Apache POI的PDF功能或者是专门用于处理PDF的库,如iText、PDFBox。 3. **响应头设置**: - 设置HTTP响应头,指定Content-Type为"application/pdf",以便告诉浏览器这是一个PDF文件。 ```java // 服务器响应 ResponseBuilder responseBuilder = Response.ok(pdfStream); responseBuilder.header("Content-Disposition", "attachment; filename=file.pdf"); responseBuilder.header("Content-Type", "application/pdf"); return responseBuilder.build(); ``` 4. **浏览器打印**: - 将生成的响应返回给客户端(通常是用户浏览器),当浏览器收到这个响应时,它会自动尝试打开PDF并提供打印选项。 5. **前端交互**: - 在前端(如HTML、JavaScript)编写代码,向服务器发起GET请求并监听返回结果,然后触发浏览器的打印操作。 ```javascript fetch('/api/print-pdf', {method: 'GET'}) .then(response => response.blob()) .then(blob => window.print(URL.createObjectURL(blob))); ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值