CV
文章平均质量分 78
天道哥哥
做正确的事>正确的做事
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
票据识别(Yolo + OCR)【过程清晰,简单美好】
本文介绍了一个基于Pytorch的票据识别项目,包含完整处理流程和核心实现。项目采用YOLO进行票据类型分类和文本框检测,结合PaddleOCR完成文本识别。重点展示了图像预处理技术,包括Deblur去模糊、对比度增强和文本框预处理等关键步骤,提供了完整的代码实现。项目结构清晰,支持自定义数据集标注,并分析了影响识别准确率的主要因素。该方案可作为票据识别的基础框架,后续可通过学习率优化、模型剪枝等技术进一步提升性能。原创 2025-08-05 17:55:54 · 1150 阅读 · 1 评论 -
InsightFace(RetinaFace + ArcFace)人脸识别项目(预训练模型,鲁棒性很好)
摘要: 本文介绍了一个基于FastAPI的本地人脸识别项目,采用RetinaFace+ArcFace预训练模型方案,实现了高效准确的人脸检测与识别。项目通过五点仿射变换(Affine Transformation)对齐人脸,相比透视变换更稳定可靠。核心功能包括:人脸检测、特征提取(112×112标准图像)、向量化存储(FAISS索引),支持戴眼镜、侧脸等复杂场景识别。文章详细分析了仿射变换的优越性,并提供了完整的代码实现方案,包括模型初始化、图像处理流程和特征匹配逻辑。该项目可直接部署使用,并建议未来可增加原创 2025-07-28 21:22:25 · 1171 阅读 · 3 评论 -
Facenet(MTCNN+InceptionResnetV1)人脸考勤项目(有缺点,但可用)
摘要: 本项目基于Flask框架实现了一个本地化人脸识别系统,采用Facenet预训练模型(MTCNN+InceptionResnetV1)进行人脸检测与特征提取。系统支持万人规模内的人脸考勤,通过图像预处理(亮度/对比度调整)提升识别效果。项目包含完整的数据处理流程:原始图像存储→MTCNN人脸裁剪→特征向量提取→相似度匹配。针对遮挡问题(如眼镜)建议采集多角度样本,未来可通过人脸关键点进行仿射变换优化。核心模块包含模型加载、特征提取和向量匹配功能,采用PyTorch实现,支持CPU/GPU运行。项目结构原创 2025-07-28 20:59:41 · 902 阅读 · 1 评论 -
Swin Transformer+FPN+Mask R-CNN(高精度分割)
本文介绍了一个基于PyTorch的前期模型验证框架,用于实例分割任务。该框架采用Swin Transformer作为骨干网络,结合FPN进行多尺度特征提取,并针对COCO数据集进行了适配优化。文章详细说明了模型设计的关键点:1)使用K-Means算法优化Anchor参数;2)可选择冻结预训练Swin参数;3)保留纯背景图片作为负样本;4)处理不连续类别ID映射问题。核心代码展示了Swin-FPN主干网络和COCO数据集加载器的实现,支持多实例掩码合并。模型在训练初期收敛较慢,但特征学习后mAP提升显著,为后原创 2025-07-23 17:16:39 · 487 阅读 · 2 评论
分享