在线英文报纸广告检测:图像处理与深度学习方法
1. 引言
广告在我们的生活中扮演着重要角色,报纸凭借其广泛的覆盖面,成为了最大的广告平台之一。许多求职者依靠报纸广告寻找工作,学生可以在报纸广告中查找入学通知或辅导课程信息,承包商则关注各类招标、投标和拍卖信息等。产品销售和促销广告吸引了众多买家,此外,报纸还有政治广告、公共通知、失物招领、征婚广告、纪念信息等,这些都具有普遍的吸引力。
为了及时采取行动,人们需要快速获取所需的广告。在线报纸使得我们可以在手机、笔记本电脑和台式机上随时随地访问多份报纸,而无需等待不同报纸的印刷版。疫情期间的居家情况进一步推动了在线报纸的发展。然而,即使是在线报纸也没有提供自动广告搜索选项,也没有搜索门户可以通过关键词匹配在各种在线报纸中搜索广告。因此,人们不得不逐页手动搜索多份报纸,以找到相关的广告。
为了解决这个问题,需要一个智能系统,它可以自动检索多份报纸中的广告图像,使它们能够立即用于及时行动,从而为 5.0 社会增添价值。自动从多份报纸中检测广告不仅对于跨范围的个性化广告搜索至关重要,还可以帮助公司和个人确保他们的广告出现在他们付费的报纸中。此外,在跟踪文章之前去除广告也很有帮助。
在线报纸大多以 .pdf 格式提供,在这些文件中检测广告并非易事。人类可以通过观察轻松识别广告图像,但使用计算机程序自动检测广告是一项具有挑战性的任务。这是一个典型的图像识别和分类问题,可以通过先提取报纸中的所有图像,然后将这些图像分类为广告或非广告来解决。这样,所有的广告图像都可以从报纸中提取出来,并用于不同的目的。结合光学字符识别(OCR)技术,还可以检索这些广告图像中的文本,从而实现基于关键词的广告搜索。
广告检测问题
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



