
《视觉图像处理工程应用》解决方案
《自动驾驶》《遥感图像》《医学图像》《文字图像》《人脸识别》工程解决方案
自动驾驶技术核心:交通仿真、感知、建图、检测、运筹。
Eric An
standing on shoulders of Giants!
我的码云地址:https://gitee.com/NavySeals
展开
-
【目标检测2024】DetCLIP
在中医药信息化发展方面,CLIP也有一些潜在的应用场景值得我们探索,例如CLIP模型可以用于识别中药材的图像,通过学习大量的中药材图像和对应的文本描述,模型能够识别和分类不同的中药材;此外,在训练过程中,CLIP采用了对比损失函数,包括对比损失(通过最大化正确图像-文本对的相似性和最小化错误图像-文本对的相似性来训练模型)和分类损失(用于训练模型对图像和文本进行多任务分类),这是对称的,意味着对于每个图像-文本对,模型会计算两个方向的损失:图像到文本和文本到图像。CLIP的工作原理可以概括为“对比学习”。原创 2024-10-22 18:57:54 · 1384 阅读 · 0 评论 -
人脸检测数据集
人脸识别常用数据集设计:1、原创 2020-06-18 16:59:19 · 541 阅读 · 0 评论 -
人脸识别工程项目学习笔记
人脸识别工程项目学习笔记原创 2020-06-05 14:21:41 · 575 阅读 · 0 评论 -
人脸识别技术综述
@TOC# 《人脸识别》系列人脸检测技术一、人脸关键点检测二、人脸检测算法1.MTCNN2.FaceNet三 、主流模型发展趋势一、人脸关键点检测示例:landmark二、人脸检测算法1.MTCNN代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings('ignor原创 2020-09-14 15:55:20 · 1167 阅读 · 0 评论 -
低质量文字图像识别
ECCV2020 PlugNet《基于可插拔的超分辨学习单元的文本识别方法》代码:https://github.com/huiyang865/plugnet论文: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123600154.pdf原创 2020-10-14 15:05:41 · 661 阅读 · 0 评论 -
OCR图像取水印
源码链接源码链接原创 2021-01-12 16:38:23 · 689 阅读 · 0 评论 -
单张图像阴影部分去除模型
原创 2020-10-13 17:17:28 · 433 阅读 · 2 评论 -
STR骨架信息文字识别模型设计
在文字识别过程中由于汉字具有骨架信息(偏旁部首),因此我认为可以使用人脸识别的检测相关算法可以更好解决以上问题landmark出来汉字的骨架信息通过偏旁部首识别应该比整体分割更高效。HyperLandmark-开源人脸106点关键、人体关节点检测...原创 2020-12-08 18:29:07 · 389 阅读 · 0 评论 -
文字识别主流算法对比分析
一、CRNN二、ROSETTANet三、RARENetRARE是一种特殊设计的深神经网络,它由一个Spatial Transformer Network(STN)和序列识别网络(SRN):主要贡献:1、提出了一种对不规则文本具有鲁棒性的场景文本识别方法。2、使用基于attention的模型并扩展了STN框架,原始STN仅在普通卷积神经网络上进行测试。3、SRN的编码器采用卷积递归结构,是基于attention模型的一个新变体。对比:...原创 2020-08-05 09:01:43 · 3843 阅读 · 0 评论 -
OCR识别效果对比结果表
目前主主流开源工程识别效果对比表原创 2020-09-23 09:24:38 · 923 阅读 · 0 评论 -
文档矫正
原创 2021-01-16 11:34:52 · 1079 阅读 · 0 评论 -
文字识别算法整理
原创 2020-07-27 16:00:33 · 1736 阅读 · 0 评论 -
EraseNet:端到端的真实场景文本擦除方法
六、相关资源EraseNet论文链接:https://ieeexplore.ieee.org/document/9180003EraseNet代码:https://github.com/lcy0604/EraseNetSCUT-EnsText数据集链接:https://github.com/HCIILAB/SCUT-EnsText原创 2020-11-04 18:04:54 · 2169 阅读 · 6 评论 -
PaddleOCR中文字识别部分算法调用
# 通过PIP安装包快速体验PaddleOCR# pip安装# pip install paddleocr# 快速使用from paddleocr import PaddleOCR, draw_ocr# Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换,参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。ocr = PaddleOCR(use_angle_cls=True, lan...原创 2021-08-16 10:07:00 · 902 阅读 · 0 评论 -
文档图像的智能版面分析(SAC)技术研究
论文地址:http://xuewen.cnki.net/CMFD-1011181342.nh.html原创 2019-06-28 11:11:37 · 3607 阅读 · 2 评论 -
CRNN中文识别训练模型
https://github.com/Sierkinhane/CRNN_Chinese_Characters_Rechttps://github.com/yinchangchang/ocr_densenethttps://github.com/chenjun2hao/Attention_ocr.pytorch原创 2020-09-25 14:05:09 · 3270 阅读 · 4 评论 -
OCR/STR文字识别常用工程模型
CTPN论文名称:《Detecting Text in Natural Image with Connectionist Text Proposal Network》开源代码:https://github.com/lvliguoren/pytorch_ctpnEAST论文名称:《Efficient and Accuracy Scene Text》开源代码:https://github.com/SakuraRiven/EASTCRAFT论文名称:《Character Region Aware原创 2020-12-08 15:53:44 · 994 阅读 · 0 评论 -
crnn文字识别训练过程出现的nan问题
crnn 文字识别中数据集应该注意问题:a)训练图片高度不能超过32并且要能整除16b)训练图片宽度不能小于高度的八倍256不然在寻找输出的的出现c)原则上最好的训练就是图片的高度都是32宽度都是280的字条里面的文字可以多可以少d)如果出现丢字修改池化层的第二个参数为1可以减少丢字详细代码阅读:模型训练出现关于nan问题的方案以crnn_chinese_characters_rec为例打开 https://github.com/Sierkinhane/crnn_chinese_charac原创 2020-06-01 09:32:41 · 1347 阅读 · 0 评论 -
RCNN融合贝塞尔曲线文字识别
为了提高准确率和速度,研究人员开发了基于循环神经网络的端到端手写识别系统,通过将输入笔画转为贝塞尔曲线序列进行分析处理,利用RNN得到了准确率更高的识别结果。在这篇文章中,研究人员以拉丁字母为例详解了新型手写字符识别背后的故事。论文地址:https://arxiv.org/pdf/1902.10525.pdf...原创 2019-03-22 11:52:51 · 739 阅读 · 0 评论 -
深度学习在医学图像上应用
细胞病理学识别和疾病组织目标检测是目标人工智能技术在影像医学和病理方向的重要应用。 该技术主要是前期的预处理技术复杂,主要原因是因为医学的相关病理特征成因复杂,图像方面的随机误差很大(噪音),图像断层之间的重叠。例如如果对图像的颜色没有识别要求,为了训练和计算方便采用的降维处理是将其灰化处理,然后使用分割算法将其不同的形态结构分离,该过程包含先将其腐蚀再膨胀然后过滤(一般情况中值滤波能去...原创 2018-07-22 08:22:19 · 6222 阅读 · 0 评论 -
医学明白检测
原创 2021-01-12 15:59:35 · 146 阅读 · 0 评论 -
V-Net、U-net、AttentionGatedVNet
由于时间不够简单描述,稍微补全。 Nassir Navab等人发表在IEEE 3D Vison上的论文V-Net,是U-Net[1]的3D版本,其实U-Net作者自己也发表了3D U-Net[2]。论文贡献:第一,3D图像分割end2ent模型(基于3D卷积),用于MRI前列腺容积医学图像分割。第二,新的目标函数,基于Dice coefficient。第三,数据扩充方法:random no...原创 2018-07-24 09:12:06 · 11779 阅读 · 9 评论 -
目标检测发展方向(2)
1、文字检测2、 文字检测3、遥感旋转目标检测Dense Label Encoding for Boundary Discontinuity Free Rotation Detection4、遥感旋转目标检测CFC-NET: A CRITICAL FEATURE CAPTURING NETWORK FOR ARBITRARY-ORIENTED OBJECT DETECTION IN REMOTE SENSING IMAGES5、医学图像Deformable Gabor Feature原创 2021-05-13 17:15:24 · 787 阅读 · 0 评论 -
医学图像分割
算法源代码原创 2021-01-12 16:23:29 · 285 阅读 · 0 评论 -
医学图像处理基本流程概念
数字图像基本概念原创 2020-06-05 16:05:06 · 1800 阅读 · 0 评论 -
遥感图像数字图像基础
原创 2020-07-27 16:23:31 · 257 阅读 · 0 评论 -
《遥感图像处理笔记》第1章
遥感图像处理原创 2022-10-02 12:50:18 · 1251 阅读 · 0 评论 -
遥感图像成像原理
模拟图像转数字图像遥感成像遥感制图遥感色阶遥感图像表示遥感图像可视化标准原创 2020-06-05 15:22:53 · 3010 阅读 · 0 评论 -
CVPR2021图像细粒度分析
地址原创 2021-06-29 14:20:42 · 1418 阅读 · 2 评论 -
EfficientDeRainy:一种高效的图像去雨雾算法
AAAI 20211. Motivation1.之前的去雨方法很多都是基于去雨模式假设或者先验知识的,去雨网络需要大量的细调优化过程,非常耗时的同时无法覆盖真实降雨场景的各种情况。因此,本文将去雨问题看作是普通的图像增强问题,用逐像素预测滤波核的方法去做去雨,是一种无模式的去雨方法。2.单一尺度的逐像素滤波核无法适应不同厚度、强度以及尺度的降雨条纹,因此本文提出Multi-dilated image filtering and fusion,即用不同膨胀率卷积来代表不同尺度的滤波核,以此来解决多尺度的原创 2021-05-26 18:07:40 · 2013 阅读 · 0 评论 -
2023年目标检测研究进展
1:本文主要总结近两年的部分目标检测成果2:本文通过这些研究给出学派发展方向参考3:本文针对理论基础研究进行探索性的分析4:个人目前相关工作内容的一些基本的介绍(命名实体识别,文献情报分析,摘要内容生成,亚像素图像处理,超分辨图像处理,编码器,解码器,生成器,判别器,基于加瓦罗定理与海涅定理的认知计算理论研究,基于多模态可编程异构的下一代芯片设计,互联式实时芯片操作系统)原创 2023-08-20 17:03:46 · 7480 阅读 · 0 评论 -
多方向遥感目标检测模型源码
常用方法:(1)角度回归(2)长边定义(3)有序四边目前主要模型:2017 RRPN 华科2017 EAST 旷世2017 R2CNN 三星2017 RR-CNN 中科院2017 DRBOX 中科院2018 TextBoxes++2018 R2PN2018 R2CNN++ (SCRDet)2018 SF-Net MDA-Net2019 CAD-Net2019 R3Det2019 IENet2020 CSL...原创 2020-07-21 17:32:50 · 864 阅读 · 0 评论 -
[ 自动驾驶工程参考方案]自动驾驶感知、建图、决策、执行发展趋势研究
自动驾驶、3D目标检测、Multi-View Fusion原创 2022-10-04 11:51:11 · 210 阅读 · 0 评论 -
液滴去除扩展注意力
论文地址代码地址原创 2021-08-16 09:12:55 · 137 阅读 · 0 评论 -
自动驾驶技术工程实现细节核心技术
常见的细分功能:车道偏离警示系统(LDW)前向碰撞预警系统(FCW)盲区监测系统(BSD)变道辅助系统(LCA)自动巡航系统(ACC)自动紧急制动(AEB)自动泊车系统(APS)疲劳驾驶分析(DMS)...原创 2021-07-12 14:28:02 · 216 阅读 · 0 评论 -
GeoSim:通过几何感知合仿真自动驾驶方法
GeoSim: Realistic Video Simulation via Geometry-Aware Composition for Self-Driving动机视觉仿真是计算机视觉技术在自动驾驶中采用传感器实现工业控制核心技术方案,这样技术的主要任务是测试自动驾驶感知技术和在不同场景下的决策技术,减少人工参与节省和降低难度。图像仿真的相关工作一般分为图形学成像技术和神经网络特征编码超分对抗生成技术两类。第一种技术成熟可控但是需要人为的操作实现,例如CARLA Simulator,Asset,原创 2021-06-10 15:22:47 · 858 阅读 · 0 评论 -
自动驾驶应用
车辆计算分析行人检测分析车道状态分析前车测距分析全自动驾驶原创 2021-01-12 17:03:20 · 136 阅读 · 0 评论 -
ECCV2020车道线检测
开源地址为:https://github.com/huawei-noah/vega论文地址为:https://arxiv.org/abs/2007.12147原创 2020-10-13 17:28:05 · 298 阅读 · 0 评论 -
自动驾驶自动驾驶数据集及系统方案
自动驾驶四个子任务数据集链接:https://pan.baidu.com/s/1nXyEIpIFslOJi3HeWmseKA提取码:x6sh原创 2020-01-11 10:12:06 · 1281 阅读 · 2 评论 -
车辆超载不同前处理对检测的影响
原图检测结果:BilateraBlurGaussMedian不同的插值算法影响Area放大Cubic放大Lanczos4LinrarNearest同样算法缩小原创 2019-03-29 10:59:33 · 176 阅读 · 0 评论