13、多类型表格检测与结构识别及高速神经网络架构搜索技术

c6d7e8f9g

于 2025-06-17 10:12:50 发布

阅读量4

点赞数

CC 4.0 BY-SA版权

分类专栏：解读《KI 2021：人工智能的进展》文章标签：表格检测表格结构识别多类型表格

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/149374229

解读《KI 2021：人工智能的进展》专栏收录该内容

40 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

多类型表格检测与结构识别及高速神经网络架构搜索技术

多类型表格检测与结构识别（Multi-Type-TD-TSR）

在表格处理领域，传统方法在检测表格边界框时不进行分类，而Prasad等人的方法会按边框对表格进行额外分类。但由于其分类仅考虑两种表格类型，且对有边框和无边框表格的定义与我们的略有不同，所以我们未采用该方法。

有边框表格的TSR算法

有边框表格的TSR算法基于Prasad等人的同名算法，利用腐蚀和膨胀操作提取无文本的行列网格单元图像。具体步骤如下：
1. 图像二值化与反转 ：将图像转换为像素值为0（黑色）或1（白色）的二值表示，然后反转这些值，得到前景（线条和字符）为白色、背景为黑色的表格图像。
2. 应用腐蚀核 ：分别对反转后的图像应用水平和垂直腐蚀核kh, kv ∈R²。腐蚀核一般是细长的垂直和水平条带，长度大于整体字体大小但小于最小网格单元的大小，且宽度不超过最小表格边框宽度。这样的腐蚀操作能去除表格中的所有字体和字符，同时保留表格边框。
3. 应用膨胀操作 ：由于腐蚀操作会使线条比原始表格边框短，为恢复原始线条形状，对两个腐蚀后的图像分别应用相同大小的膨胀操作，得到垂直和水平线条的图像。
4. 图像合并与反转 ：使用按位或操作合并两个图像，并再次反转像素值，得到光栅单元图像。
5. 提取边界框 ：使用轮廓函数在网格单元图像上提取每个单个网格单元的边界框。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。