21、漫画书框架与文本提取及手绘图形统一表示方法

漫画书框架与文本提取及手绘图形统一表示方法

漫画书框架与文本提取

在处理漫画书时,准确提取框架和文本区域是非常重要的。下面将详细介绍一种新的提取方法。

问题背景

在漫画中,存在一些特定的框架问题,如缺失框架、部分框以及多框架重叠等情况。以往处理重叠元素的方法耗时较长,且参数选择不明确。同时,文本分割方面,之前的工作大多假设文本是黑色写在白色气球内,存在一定局限性。

新方法介绍
  • 目标 :为了索引目的,同时从漫画页面中提取框架和文本区域。
  • 处理流程
    1. 预处理
      • 灰度转换:将图像转换为灰度图。
      • 二值化阈值计算:根据页面边框像素的中值计算阈值。
      • 图像反转:若中值更接近黑色灰度,则进行图像反转,以确保最终得到白色背景。
      • 二值化:将图像进行二值化处理。
      • 连通组件提取:使用CC算法提取所有元素的边界框。
    2. ROI分类
      • 定义ROI为连通组件边界框,使用k - means算法根据ROI高度进行分类,分为“框架”“文本”和“噪声”三类。
      • 计算每类的方差,若“框架”类方差高,则应用特定算法改进之前的步骤。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值