自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 MinerU直播问题记录

看这个PDF-Extract-Kit 1.0 其中model-json是个块是什么类型内容。middle-json是这个块是什么内容。解答:是根据特征进行的,比如页码等,,会进行换行等。比如论文作者,在上面居中,这也是特征。标题比较大比较出居中这些,也是特征,视觉判断。4、我这边想按章节和小标题切分内容,但是直接生成的md对标题以及层级的解析不是很好,有什么好的方法吗?解答:根据line的高度进行聚类。解答:有middle-json,里面有坐标,内容等。2、目录是如何检测识别的,标题是怎么检测的。

2024-11-20 20:34:14 208

原创 111111111111

3、计算机应用与软件。

2024-11-02 19:20:33 122

原创 docker+oracle19c+python操作

安装:暂无。使用:暂无。

2024-06-13 10:42:46 494

原创 邮件msg格式正文+附件提取

邮件msg格式附件提取

2024-06-12 15:46:28 974

原创 Linux命令大全

1.1 命令:chown : 举例:chown user1:group1 /opt/data。

2023-10-20 16:29:00 62 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除