如何将模糊的扫描版pdf转为清晰的pdf或word_pdf问题小结

本文详细介绍使用Python库如pdfplumber和fitz进行PDF文件的处理,包括表格信息的提取,并分享了提高PDF阅读清晰度的方法。通过代码示例展示了如何将PDF中的表格转换为Excel格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

20220109

在这里插入图片描述
pdf拆分
不要点提取页面为单独文件 这样会提取出完整的一个文件
而如果选了的话会全部拆分成一页一页

20220107

# code=utf-8
import os
import time
import sys
import fitz
import pdfplumber
from openpyxl import Workbook
from tqdm import tqdm
PATH = r'D:\project_pycharm\medicine_standard_lib/'

def analysis_table(pdf_file):
    # 打开表格
    workbook = Workbook()
    sheet = workbook.active

    # 打开pdf
    with pdfplumber.open(pdf_file) as pdf:
        # 遍历每页pdf
        for page in tqdm(pdf.pages):
            # 提取表格信息
            table = page.extract_table()
            # print(table)
            # 格式化表格数据
            for row in table:
                # print(row)
                sheet.append(row)
    workbook.save(filename="医保药品分类与代码数据库更新202110.pdf.xlsx")

analysis_table(PATH+'医保药品分类与代码数据库更新202110.pdf')
抽取表格

https://blog.youkuaiyun.com/wxplol/article/details/109304946
基于pymupdf的PDF的文本、图片和表格信息提取

https://mp.weixin.qq.com/s/59UiYl1AJh-kWQOCeeIMHA
各种pdf解析库

https://www.jianshu.com/p/d38f2a582aa8
Python实现PDF内容抽取PyMuPDF

在这里插入图片描述

平滑的地方都选上
自定义分辨率
或者用2345 pdf阅读器 很清晰

可以调节显示器的 clear vision 来调节对比度 增加显示效果
模糊的pdf文档会变的清晰

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.youkuaiyun.com/xbs150/article/details/84870176
            </div>
                                                <!--一个博主专栏付费入口-->
         
         <!--一个博主专栏付费入口结束-->
        <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
                                    <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
            <div class="htmledit_views" id="content_views">
                                        <p><strong>AdobeAcrobat是一款不错的pdf编辑阅读器,大家常用来阅读文献资料,但是在安装完成使用时候,常常出现页面字体不清晰的情况,需要做一下调整:</strong></p>

(1)打开AdobeAcrobat属性中的兼容性设置界面(右击桌面AdobeAcrobat的图标,选择属性,点击兼容性)

(2)对兼容性做如下设置,调整成为程序自动使用高DPI

(3)打开AdobeAcrobat,选择编辑——首选项——页面设置,将分辨率调整成为使用系统设置,渲染部分的平滑文本选择用于显示器,其他的默认打钩。页面布局和缩放类型可以自己调整了看,这里选择自动。

(4)重启AdobeAcrobat即可

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值