Biff：提取reMarkable平板生成PDF中的文本和图像

裴才隽Tanya

于 2024-12-28 11:46:08 发布

阅读量282

点赞数 3

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_01029/article/details/144786203

Biff：提取reMarkable平板生成PDF中的文本和图像

biff Extract text and images from highlighted pdf generated with reMarkable tablet. 项目地址: https://gitcode.com/gh_mirrors/bif/biff

Biff是一个开源项目，旨在从使用reMarkable平板电脑高亮的PDF文件中提取文本和图像。该项目主要使用Python编程语言开发。

核心功能

Biff的核心功能是能够识别PDF文件中被高亮的文本区域，并将这些文本区域导出为Openoffice文本文档（ODT格式）。同时，该项目还可以识别并裁剪出被框选的图像区域，并将其作为图像插入到输出文档中。

最近更新功能

项目的最近更新包含以下新功能和改进：

用户界面（UI）的创建：新增了一个名为Biff_UI.py的用户界面，使得用户可以更加方便地使用这个工具。
支持双栏PDF：添加了处理双栏PDF文件的功能，可以依次解析从左至右的栏。
图像质量选项：提供了调整提取图像质量的选项，用户可以根据需要设置不同的质量级别。
提取改进：对部分提取文本的问题进行了改进，现在只有在高亮完全覆盖的文本才会被提取。

通过这些更新，Biff不仅提高了用户体验，还在功能上有了进一步的完善，使得从PDF中提取高亮文本和图像变得更加高效和精准。

biff Extract text and images from highlighted pdf generated with reMarkable tablet. 项目地址: https://gitcode.com/gh_mirrors/bif/biff

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

裴才隽Tanya 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。