EAST: An Efficient and Accurate Scene Text Detector中遇到的问题

最新推荐文章于 2024-12-28 09:42:44 发布

原创最新推荐文章于 2024-12-28 09:42:44 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

练习同时被 3 个专栏收录

4 篇文章

订阅专栏

Python

3 篇文章

订阅专栏

机器学习

2 篇文章

订阅专栏

本文记录了解决EAST项目中遇到的编译错误的过程，包括安装必要的依赖包、调整编译选项以及更改脚本以适应不同版本的Python环境。

https://github.com/argman/EAST

1.Error 127 和

fatal error: Python.h: No such file or directory

这两个是编译环境没准备好， apt-get安装g++和python-dev解决

2.还是/lanms下文件的问题

"undefined symbol: _Py_ZeroStruct"

运行run_demo_server.py的时候出现。查到不同python环境下编译选项的问题。尝试修改了makefile，还是报错。

最后我的解决方法是把run_demo_server.py修改为在python2下运行。修改时候注意下functools在python3.2中才出现，在2.7中可以用functools32代替。否则出现

AttributeError: 'module' object has no attribute 'lru_cache'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Vchnun

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

EAST（Efficient and Accurate Scene Text Detector）在旋转目标检测中的应用详解

浩瀚之水的专栏

05-08

201

EAST通过端到端的单阶段架构和灵活的几何表示（旋转矩形或四边形），成为旋转目标检测的高效解决方案。在文本、遥感和工业检测中表现优异，但需针对特定场景优化角度回归、特征对齐和后处理流程。未来可结合Transformer等新型架构，进一步提升对复杂旋转目标的建模能力。

解决PaddleOCR安装lanms-neo时报错，Could not build wheels for lanms-neo ...

Interesting

02-17

6833

解决PaddleOCR安装依赖的问题，Could not build wheels for lanms-neo, which is required to install pyproject

参与评论您还未登录，请先登录后发表或查看评论

EAST: An Efficient and Accurate Scene Text Detector（自然场景下文本识别）训练，测试

pursuit_zhangyu的博客

05-24

2694

首先介绍一下我的环境配置，ubuntu16.04+cuda9.0，cudnn7.0，tensorflow-gpu=1.8简介其实对这个不是很有研究的，只是要参加一个阿里天池的比赛，然后用这个跑了一下，成绩很一般。论文原地址：https://arxiv.org/abs/1704.03155v2源码：https://github.com/argman/EAST下载主要是根据上面github源码进行的，...

EAST: An Efficient and Accurate Scene Text Detector

没有期待的日子反而会顺顺利利

11-22

355

1. Network Design 只包含两个阶段：全卷积网络(FCN)和NMS，其中FCN网络包括三个部分，特征提取+特征合并分支+输出层部分。由FCN直接生成单词或者文本行的逐像素预测，生成旋转的矩形或者四边形的候选区域，形成文本区域，最后由NMS处理特征提取部分想法来自U-shape的结合不同级别feature-map，设计四个层次的特征图，实验采用的VGG的各个feature...

EAST解读 —— An Efficient and Accurate Scene Text Detector

aift的专栏

07-22

3257

文章目录简述现有工作问题数据集网络结构特征提取层特征合并层结果输出层标签生成损失函数文本分割LossRBOX边界偏移LossRBOX偏移角度损失QUAD偏移LossLocality-Aware NMS实验结果简述 EAST是旷视科技CVPR 2017年的一篇场景文本检测算法，其特点有：结构简单，速度快，端到端等，Github上有很好的复现代码，是一种实用性很强的文本检测算法。 paper：ht...

An Efficient and Accurate Scene Text Detector

qq_38343151的博客

02-01

494

在本文中，我们提出一个快且准确的场景文本检测算法，只有两步。这个算法利用全卷积网络模型来直接产生单词或文本行级别的预测，消除了冗余和慢的中间步骤。产生的文本预测，既可以是旋转的矩形也可以是四边形，这些预测结果送入非极大抑制中来得到最终的结果。本文工作得贡献是三部分：我们提出了一种包括两步得场景文本检测方法：FCN和NMS合并阶段。FCN直接产生文本区域，消除了中间步骤得冗余和耗时。算法...

EAST: An Efficient and Accurate Scene Text Detector翻译

myc的博客

01-31

4006

Abstract 用于场景文本检测的先前方法已经在各种基准测试中获得了良好的性能。然而，在处理具有挑战性的场景时，即使配备了深度神经网络模型，它们通常也会达不到很好性能，因为整体性能取决于管道中多个阶段和组件的相互作用。在这项工作中，我们提出了一个简单而强大的管道，可以在自然场景中产生快速准确的文本检测。算法流程直接预测完整图像中任意方向和四边形形状的单词或文本行，消除了使用单个神经网络的不必要的...

EAST: An Efﬁcient and Accurate Scene Text Detector 论文阅读

Therock_of_lty的博客

10-12

663

EAST: An Efﬁcient and Accurate Scene Text Detector 论文阅读Reference正文摘要引言相关工作方法算法网络设计标签生成损失函数训练位置感知的NMS个人总结 Reference X. Zhou, C. Yao, H. Wen, Y. Wang, S. Zhou, W. He, and J. Liang, “East: an efficient and accurate scene text detector,” in Proceedings of the

EAST: An Efficient and Accurate Scene Text Detector 自然场景下的文字识别（原理及代码理解）

热门推荐

zhangwei15hh的博客

04-11

1万+

最近在学习自然场景下的文字识别，有一个比较新的模型EAST，所以学习一下。论文原地址：https://arxiv.org/abs/1704.03155v2 源码：https://github.com/argman/EAST 模型特点及优势该模型直接预测全图像中任意方向和四边形形状的单词或文本行，消除不必要的中间步骤（例如，候选聚合和单词分割）。通过下图它与一些其他方式的步骤...

windows下 lanms包

07-27

我在其他windows下编译这个包的时候一直报错，未找到原因，但是我笔记本编译成功了，所以拷贝到这个地方，希望大家能用到

【论文翻译】EAST: An Efficient and Accurate Scene Text Detector高效准确的场景文本检测器

Gavid的博客

10-11

1938

文章目录摘要引言高效准确的场景文本检测器摘要先前的场景文本检测方法已经在各种环境中通过了性能基准。但是，在应对挑战性场景时（即使配备深度神经网络模型），因为整体性能取决于管道中多个阶段和组件的相互作用。在这项工作中，我们提出了一个简单但功能强大的管道，该管道可以在自然场景中产生快速而准确的文本检测。流水线可以通过单个神经网络直接预测完整图像中任意方向和四边形形状的单词或文本行，从而消除...

外刊文章翻译-An Efficient and Accurate Scene Text Detector

baidu_33164415的博客

12-29

183

外刊文章翻译-An Efficient and Accurate Scene Text Detector

PyTorch Re-Implementation of EAST: 高效准确的场景文本检测器

gitblog_00577的博客

12-28

310

PyTorch Re-Implementation of EAST: 高效准确的场景文本检测器 1. 项目基础介绍本项目是基于PyTorch的EAST（Efficient and Accurate Scene Text Detector）算法的重新实现。EAST是一种用于检测图像中文字的高效准确算法，它能够在多种场景下进行文本检测。该项目的编程语言主要使用Python。 2. 项目核心功能项目...

EAST笔记（一）

juluwangriyue的博客

07-12

1475

最近在看文本检测EAST，论文为《EAST: An Efficient and Accurate Scene Text Detector》。先介绍开源程序怎么跑通，理论部分后面会补充。代码地址：https://github.com/argman/EAST ，这是原作者参与的一份tensorflow版本代码，网上还有其他的实现。开源代码一般都是在linux环境下编写、测试、运行。我暂时用windows比较多，所以我都是先在windows下跑通程序的，所以不可避免的会遇到一些问题，不过这些问题大

paddle ocr安装时lanms依赖报错问题解决

every place is the center of the universe

12-09

165

centos 安装lanms 报错问题解决

windows安装lanms-neo问题处理

aizaiyishunjian的博客

01-27

3018

paddleocr安装过程中遇到lanms-neo无法安装的问题，通过源码安装，逐步解决MSVC依赖问题，C++编译时的头文件、链接库无法找到的问题，最终lanms-neo安装成功。

EAST：RuntimeError: Cannot compile lanms解决方案

Diliduluw的博客

12-19

1713

运行EAST eval.py代码时发现无法编译lanms，上网查了很多解决方案，可能家家有本难念的经吧，总算是万里挑一找到一个解决方案先前的失败尝试（但是大家可以试试）：升级gcc/g++版本https://blog.youkuaiyun.com/weixin_39461307/article/details/95881408 增加pyconfig.h搜索路径https://blog.csdn...

Efficient and Accurate Scene Text Detector

最新发布

01-19

### 高效且准确的场景文本检测方法 #### 1. EAST (Efficient and Accurate Scene Text Detector) EAST 是一种端到端的文字检测算法，能够直接预测文字边界框。该模型设计简单有效，在保持较高准确性的同时实现了较快的速度。 - **特点**： - 可以处理任意形状的文字实例。 - 使用全卷积网络结构，无需复杂的预处理或后处理操作。 ```python import cv2 import numpy as np def east_text_detection(image_path): net = cv2.dnn.readNet('frozen_east_text_detection.pb') image = cv2.imread(image_path) orig = image.copy() (H, W) = image.shape[:2] layerNames = [ "feature_fusion/Conv_7/Sigmoid", "feature_fusion/concat_3" ] blob = cv2.dnn.blobFromImage(image, 1.0, (W, H), (123.68, 116.78, 103.94), swapRB=True, crop=False) net.setInput(blob) (scores, geometry) = net.forward(layerNames) # 进一步处理 scores 和 geometry 来获取最终的结果... ``` [^1] #### 2. CRAFT (Character Region Awareness For Text Detection) CRAFT专注于字符级别的特征学习，可以更精确地捕捉不规则排列的文字区域。此方法特别适合于弯曲或者倾斜的文字行。 - **优势**： - 对抗变形能力强，适用于多种复杂背景下的文本识别任务。 - 提供了更加细致化的分割结果，有助于后续的文字识别工作。 ```python from craft import CRAFT import torch from PIL import Image model = CRAFT(pretrained=True).eval() image = Image.open('path_to_image.jpg').convert('RGB') with torch.no_grad(): y, feature = model(torch.unsqueeze(transform(image), dim=0)) # 后续可以根据y来绘制边框或者其他可视化操作 ``` [^2] #### 3. PSENet (Pixel Aggregation Segmentation Network for Arbitrary-Shaped Scene Text Detection) PSENet利用像素聚合的思想来进行任意形状文本的检测。它通过多尺度融合的方式增强了对于细长物体的理解能力，并且能够在不同的比例尺下稳定表现。 - **亮点**： - 支持自由形态的文字轮廓提取。 - 结合了全局上下文信息和局部细节特性，提高了鲁棒性和泛化性。 ```python from pse import decode as pse_decode import torchvision.transforms.functional as F img_tensor = F.to_tensor(Image.open(img_file)).unsqueeze(0) preds = model(img_tensor)[-1].detach().cpu().numpy()[0] boxes = pse_decode(preds, min_area_threshold=500) ``` [^3]