- 博客(67)
- 收藏
- 关注
原创 深度学习——基于卷积神经网络实现食物图像分类【3】(保存最优模型)
本项目的目标是构建一个能够识别20种不同食物的图像分类系统。简化但高效的数据预处理流程三层CNN网络架构设计训练过程中自动保存最佳模型完整的训练-评估流程实现我们继承PyTorch的Dataset关键改进更清晰的数据加载逻辑完善的类型转换处理支持灵活的数据变换自定义数据集的处理方法CNN网络的设计与实现训练过程中的模型保存策略完整的训练-评估流程通过本教程,读者可以掌握PyTorch图像分类的基本方法,并能够根据实际需求进行调整和优化。
2025-06-15 22:17:58
615
原创 深度学习——基于卷积神经网络实现食物图像分类【2】(数据增强)
食物图像分类是计算机视觉中的一个常见应用场景。在本项目中,我们将构建一个能够识别20种不同食物的分类系统。数据准备与预处理构建自定义数据集类设计CNN模型架构训练模型并评估性能优化与结果分析我们继承PyTorch的Dataset__init__: 初始化数据集,读取标注文件__len__: 返回数据集大小: 根据索引返回图像和标签,应用预处理本文详细介绍了使用PyTorch实现食物分类的全流程。通过合理的网络设计、数据增强和训练策略,我们能够构建一个有效的分类系统。
2025-06-15 22:10:27
616
原创 深度学习——基于卷积神经网络实现食物图像分类【1】(datalodar处理方法)
在这个项目中,我们将使用PyTorch框架构建一个卷积神经网络(CNN)来实现食物图像分类任务。我们的数据集包含20种不同的食物类别,包括八宝粥、巴旦木、白萝卜、板栗等常见食物。本文将详细介绍从数据准备、模型构建到训练和评估的完整流程。transforms.Resize([256,256]), # 统一图像大小为256x256transforms.ToTensor(), # 转换为PyTorch张量]),]),我们创建了一个继承自。
2025-06-14 17:29:56
846
原创 深度学习——基于卷积神经网络的MNIST手写数字识别详解
通过本文,我们学习了如何使用PyTorch实现一个完整的手写数字识别项目。从数据加载、模型构建到训练和评估,每个步骤都展示了PyTorch框架的简洁和强大。这个简单的CNN模型在MNIST数据集上可以达到很高的准确率,为进一步学习更复杂的计算机视觉任务打下了良好基础。调整网络结构(增加层数、改变通道数)尝试不同的优化器和学习率添加数据增强技术在更复杂的数据集上应用类似方法希望这篇教程能帮助你入门PyTorch和计算机视觉领域!
2025-06-14 16:14:08
423
原创 深度学习——基于PyTorch的MNIST手写数字识别详解
60,000张用于训练10,000张用于测试图像为灰度图,28×28像素数字已居中处理,减少了预处理工作数据加载与预处理神经网络模型构建训练与测试流程关键概念解析这个项目虽然简单,但包含了深度学习项目的基本要素,是学习PyTorch和计算机视觉的优秀起点。通过调整模型结构和超参数,可以进一步提高识别准确率。
2025-06-13 21:14:36
1879
3
原创 基于OpenCV实现实时颜色检测
实时视频捕捉在视频帧中划定特定检测区域将检测区域转换为HSV色彩空间分析区域内的色调(H)值根据H值范围判断颜色类型实时显示结果本文介绍了一个基于OpenCV的实时颜色识别系统,通过HSV色彩空间转换和色调范围判断实现了基本颜色识别功能。该系统可以作为更复杂计算机视觉项目的基础,通过进一步优化和扩展,能够满足各种实际应用需求。希望这篇文章能帮助你理解颜色识别的基本原理和实现方法。如果你有任何问题或改进建议,欢迎在评论区讨论!
2025-06-13 21:00:49
1633
原创 基于OpenCV实现视频运动目标检测与跟踪
本文介绍了基于OpenCV的视频运动目标检测实现方法。通过背景建模、形态学处理和轮廓分析等技术,我们能够有效地检测和标记视频中的运动物体。这种方法计算效率高,适合实时应用场景。完整代码已在上文给出,读者可以自行尝试并调整参数观察不同效果。OpenCV提供了丰富的计算机视觉功能,值得深入学习和探索。
2025-06-12 23:52:22
1115
原创 基于OpenCV和深度学习实现图像风格迁移
通过OpenCV的dnn模块,我们可以轻松加载预训练的深度学习模型实现图像风格迁移。这种方法简单高效,适合快速实现艺术效果。你可以从OpenCV的示例代码或模型库中找到更多风格迁移模型进行实验。希望这篇教程对你有所帮助!如果你有任何问题,欢迎在评论区留言讨论。
2025-06-12 23:29:11
616
1
原创 基于OpenCV的图像增强技术:直方图均衡化与自适应直方图均衡化
直方图均衡化是图像增强的基础技术,而CLAHE则是其改进版本,更适合处理局部对比度变化大的图像。快速实现图像直方图分析应用全局直方图均衡化使用CLAHE进行局部自适应增强直观比较不同处理方法的差异掌握这些技术将为你的图像处理工作提供强大工具。在实际应用中,建议根据具体需求选择合适的算法和参数。
2025-06-11 22:57:58
898
原创 使用OpenCV和Python进行图像掩膜与直方图分析
通过这个简单的例子,我们学习了如何使用OpenCV进行基本的图像掩膜操作和直方图分析。这些技术是更复杂图像处理任务的基础,掌握它们将为你的计算机视觉之旅打下坚实基础。希望这篇博客对你有所帮助!如果你有任何问题或建议,欢迎在评论区留言。
2025-06-11 22:30:13
1170
原创 图像直方图分析:全面掌握OpenCV与Matplotlib绘制技巧
掌握图像直方图的分析方法对于数字图像处理至关重要。本文介绍了多种直方图绘制方法,从简单的灰度图像分析到复杂的彩色图像通道分离,读者可以根据实际需求选择合适的方法。直方图不仅是图像分析的工具,更是许多高级图像处理算法的基础。希望这篇博客能帮助你更好地理解和应用图像直方图分析技术!在实际项目中,不妨多尝试不同的bin数量和绘制方式,找到最适合你应用场景的分析方法。
2025-06-10 20:25:00
1460
原创 基于OpenCV的风格迁移:图像金字塔方法
图像金字塔是由同一图像的不同分辨率组成的一系列图像。金字塔的底部是原始高分辨率图像,而顶部是低分辨率图像。通过这种方式,图像金字塔可以表示图像在不同尺度下的信息,这在许多计算机视觉任务中非常有用,如目标检测、图像融合和特征提取等。图像金字塔主要分为两种类型:高斯金字塔和拉普拉斯金字塔。下面我们将分别介绍它们的原理和实现。图像金字塔是计算机视觉中一种基础而强大的工具,它允许我们在多个尺度上分析和处理图像。
2025-06-10 20:01:34
816
原创 基于OpenCV的物体跟踪:CSRT算法
实时摄像头视频捕获用户交互式选择跟踪目标(ROI)使用CSRT算法进行目标跟踪实时显示跟踪结果通道可靠性:利用颜色通道的可靠性信息空间可靠性:考虑目标的空间分布判别式相关滤波:使用相关滤波进行目标定位高精度:相比KCF等算法,CSRT通常能提供更精确的跟踪结果较高计算成本:精度提升带来的是稍高的计算开销本文介绍了一个基于OpenCV的CSRT跟踪器的实时目标跟踪系统实现。通过这个简单的示例,读者可以了解目标跟踪的基本原理和实现方法。
2025-05-21 23:55:09
1352
2
原创 基于OpenCV的实时文档扫描与矫正技术
实时摄像头捕获图像边缘检测和轮廓查找文档轮廓识别透视变换矫正文档二值化处理增强可读性本文介绍了一个基于OpenCV的实时文档扫描与矫正系统,通过边缘检测、轮廓分析和透视变换等技术,实现了文档的自动检测和矫正。该系统可以方便地应用于日常文档数字化工作,提高工作效率。完整代码已在上文中给出,读者可以根据自己的需求进行修改和扩展。OpenCV提供了强大的图像处理能力,结合Python的简洁语法,使得开发这样的实用系统变得简单高效。
2025-05-18 22:27:40
2317
11
原创 基于OpenCV的SIFT特征和FLANN匹配器的指纹认证
这个指纹认证系统主要通过比较源指纹图像和模板指纹图像的特征点匹配数量来判断是否认证通过。系统使用SIFT算法提取图像特征点,然后通过FLANN匹配器进行快速近似最近邻搜索,最后根据匹配点数量决定认证结果。本文介绍了一个基于SIFT和FLANN的简单指纹认证系统实现。通过特征点匹配数量来判断认证结果,虽然简单但体现了计算机视觉在生物识别中的应用。读者可以根据实际需求进一步优化和完善这个系统。希望这篇博客对你有所帮助!如果有任何问题,欢迎在评论区留言讨论。
2025-05-17 17:39:24
1076
原创 [YOLO模型](4)YOLO V3的介绍
YOLO V3 的网络架构只有卷积层,且有三个输出。YOLO V3 先验框共有9个,分为小、中、大三种scale,每种有三个规格。引入残差网络思想,搭建更深层次的网络。使用Logistic分类器替代Softmax,适用于多分类的任务。
2025-05-17 13:33:49
1111
1
原创 基于OpenCV的SIFT特征匹配指纹识别
特征提取:使用SIFT算法提取指纹图像的关键点和特征描述符特征匹配:使用FLANN(快速近似最近邻)匹配器进行特征点匹配身份识别:通过匹配点数量判断指纹身份本文实现了一个基于SIFT特征的指纹识别系统,虽然相对简单,但包含了指纹识别的基本流程。该系统可以进一步扩展为更复杂的生物特征识别系统,如加入活体检测、多模态识别等功能。适用场景小型考勤系统门禁系统个人设备身份验证希望本文能帮助读者理解指纹识别的基本原理和实现方法。如有任何问题,欢迎在评论区留言讨论。
2025-05-16 21:58:51
1303
原创 基于OpenCV的人脸微笑检测实现
本文介绍了一个基于OpenCV Haar级联分类器的实时微笑检测系统。虽然Haar级联分类器在复杂场景下可能表现不佳,但它的计算效率高,非常适合初学者学习和快速原型开发。通过调整参数和优化流程,可以在实际应用中获得不错的效果。
2025-05-15 22:20:18
1546
原创 基于OpenCV中的图像拼接方法详解
通过本文的介绍,相信读者已经对基于特征点的图像拼接技术有了全面的了解。这种技术在计算机视觉领域有着广泛的应用,掌握它将为你的图像处理项目带来更多可能性。
2025-05-14 21:19:52
1421
原创 OpenCV中的光流估计方法详解
本文实现了一个基于OpenCV的简单运动目标跟踪系统,展示了光流法的基本应用。虽然实现相对简单,但包含了目标跟踪的核心思想。读者可以在此基础上进行扩展,开发更复杂的跟踪系统。我们定能不负所托 不负所望!!!🚀🚀🚀。
2025-05-13 21:17:22
1207
2
原创 基于OpenCV的人脸识别:Haar级联分类器
图像的基本预处理Haar级联分类器的使用人脸检测与结果可视化Haar特征虽然是比较传统的方法,但在要求不高的场景下仍然简单有效。对于更复杂的应用,可以考虑基于深度学习的人脸检测算法如MTCNN等。希望这篇教程对你有所帮助!欢迎留言交流遇到的问题或改进建议。心态放平,终见曙光。任何时候开始努力都不晚!!!🚀🚀🚀。
2025-05-12 20:57:26
1104
原创 基于OpenCV的人脸识别:LBPH算法
这个系统使用了OpenCV的LBPH(Local Binary Patterns Histograms)人脸识别算法,通过训练已知的人脸图像,然后对新的图像进行预测识别。通过这个简单的示例,我们了解了如何使用OpenCV实现基础的人脸识别功能。虽然这个系统比较简单,但它展示了人脸识别的基本原理和工作流程。随着样本数量的增加和算法的优化,系统的识别准确率可以进一步提高。希望这篇博客对你理解人脸识别技术有所帮助!如果你有任何问题或建议,欢迎在评论区留言。万事胜意,得偿所愿!加油各位!!!🚀🚀🚀。
2025-05-11 23:44:56
2080
4
原创 基于OpenCV的人脸识别:FisherFaceRecognizer算法
这个系统使用OpenCV的算法,通过训练少量样本图片,实现对输入图像的分类识别。加载训练图像并预处理训练FisherFace识别器对测试图像进行预测在图像上显示中文识别结果这个简单的系统展示了如何使用OpenCV实现基本的人脸识别功能。虽然只使用了少量训练样本,但已经能够完成基本的分类任务。增加更多训练样本提高准确性使用更先进的算法如LBPH或深度学习模型添加人脸检测步骤实现全自动识别构建更完善的用户界面完整代码已在上文展示,读者可以根据需要调整参数或扩展功能。
2025-05-10 17:43:36
1071
原创 基于OpenCV的人脸识别:EigenFaces算法
本文演示了如何使用OpenCV的**EigenFaceRecognizer对预先准备好的面部图像进行训练,然后对新的测试图像进行识别。我们使用了名为为"linyuner"和"chendulin"的多张照片作为训练集,然后测试系统能否正确识别新输入的照片。通过这个简单的例子,我们展示了如何使用OpenCV快速实现一个基础的人脸识别系统。虽然EigenFaces算法相对简单,但它很好地演示了人脸识别的基本原理,对于理解更复杂的系统有很大帮助。希望这篇博客对你有所帮助!
2025-05-09 22:36:54
1062
原创 [YOLO模型](1)YOLO的介绍
YOLO(You Only Look Once)是一种基于深度学习的目标检测算法,由Joseph Redmon等人于2016年提出。它的主要特点是速度快且准确性高,非常适合用于实时目标检测任务。YOLO将目标检测任务看作一个单一的回归问题,直接从图像像素到边界框坐标和类别概率的映射。这意味着YOLO只需要对图像进行一次前向传播,就可以同时预测多个边界框和它们的类别,从而大大减少了计算量。YOLO是一种基于深度学习的目标检测算法。注意,是一个回归问题!!
2025-05-09 12:47:11
1183
原创 使用OpenCV 和 Dlib 实现人脸融合技术
人脸关键点检测人脸对齐和仿射变换人脸区域分割和融合颜色校正JAW_POINTS = list(range(0,17)) # 下巴轮廓点RIGHT_BROW_POINTS = list(range(17,22)) # 右眉毛LEFT_BROW_POINTS = list(range(22,27)) # 左眉毛NOSE_POINTS = list(range(27,35)) # 鼻子RIGHT_EYE_POINTS = list(range(36,42)) # 右眼。
2025-05-07 15:47:34
1096
原创 使用OpenCV 和 Dlib 实现年龄性别预测
本文介绍了一个完整的实时人脸属性分析系统,从模型加载、图像预处理到属性预测和结果显示。该系统展示了如何将多个深度学习模型集成到一个实用的应用中。可以根据实际需求调整模型参数、优化性能或扩展功能。根据场景调整置信度阈值考虑添加异常处理机制对模型输出进行后处理以提高准确性。
2025-05-06 23:12:00
1268
原创 使用OpenCV 和Dlib 实现表情识别
面部关键点检测四种面部特征计算表情分类逻辑实时视频处理与结果显示"""向图片中添加中文"""if (isinstance(img,np.ndarray)): # 判断是否OpenCV图片类型img = Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB)) # 实现array到image的转换draw = ImageDraw.Draw(img) # 在img图片上创建一个绘图的对象# 字体的格式。
2025-05-06 12:53:37
1338
原创 使用OpenCV 和 Dlib 进行卷积神经网络人脸检测
通过这个简单的示例,我们展示了如何使用dlib和OpenCV实现一个有效的人脸检测系统。虽然代码只有不到20行,但它包含了计算机视觉中人脸检测的核心流程。你可以基于此代码进一步开发更复杂的人脸相关应用。慢也好,步子小也好,往前走就好,只要我们一步步前进,都为时不晚。加油!🚀🚀🚀。
2025-05-05 22:29:00
1253
原创 使用OpenCV 和 Dlib 实现疲劳检测
Dlib:用于人脸检测和68个关键点定位OpenCV:视频流处理和图像显示:用于计算欧氏距离Pillow:支持在图像上添加中文文本本文介绍了一个基于Dlib和OpenCV的实时疲劳检测系统。实时性:可在普通电脑上实时运行准确性:基于几何特征而非颜色特征,适应不同光照条件可扩展性:框架可轻松扩展到其他行为检测完整代码已在上文中提供,读者可以自行尝试实现或在此基础上进行二次开发。这个项目不仅具有实用价值,也是学习计算机视觉和人脸分析的优秀案例。理想的风会吹进现实,熬过的夜也会变成光!
2025-05-05 22:04:48
1432
原创 使用 OpenCV 和 Dlib实现轮廓绘制
"""连接指定范围内的关键点"""这个函数用于连接一系列关键点,形成连续的线条,常用于绘制眉毛、下巴等轮廓。pts:从shape变量中切片获取从start到end索引之间的所有点,存储在pts中ptA是前一个点(当前点减1)ptB是当前点将它们转换为元组形式(OpenCV的line函数需要坐标以元组形式传递"""绘制指定范围内关键点的凸包"""凸包函数特别适合用于眼睛和嘴巴的轮廓绘制,因为它可以自动计算并连接最外围的点,形成闭合区域。Facial存储从 start 到 end 的所有点(
2025-05-04 15:13:09
1299
原创 使用OpenCV和dlib库进行人脸关键点定位
dlib提供了一个简单而强大的人脸关键点检测解决方案。通过本文介绍的方法,你可以快速实现精准的人脸特征点定位,为后续的人脸分析应用奠定基础。虽然深度学习-based的方法在某些场景下可能更准确,但dlib的解决方案在速度和易用性方面仍有很大优势。
2025-04-28 22:47:45
1648
原创 使用 OpenCV 和 dlib 进行人脸检测
dlib 是一个现代化的 C++ 机器学习工具库,同时也提供 Python 接口。它由 Davis King 开发并维护,广泛应用于计算机视觉、图像处理和机器学习任务。主要特点高性能:优化的 C++ 实现,运行速度快跨平台:支持 Windows、Linux、macOS丰富的功能:人脸检测、特征点识别、物体检测、深度学习等易用的 Python API:与 NumPy、OpenCV 无缝集成开源免费:采用 Boost 软件许可,可商用OpenCV:用于图像读取、处理和显示。dlib。
2025-04-27 22:30:45
1632
原创 OpenCV中的SIFT特征提取
尺度不变性:在不同尺度的图像中都能检测到相同的特征点旋转不变性:不受图像旋转的影响光照鲁棒性:对光照变化不敏感视角部分不变性:能够处理一定程度的视角变化SIFT作为计算机视觉领域的里程碑算法,尽管已有20多年历史,但其核心思想仍影响着现代特征提取方法的发展。通过OpenCV的简洁接口,我们可以轻松地将这一强大工具应用到各种视觉任务中。理解SIFT的原理和实现,对于掌握更先进的视觉算法也大有裨益。
2025-04-25 21:14:21
1710
原创 自然语言处理(NLP)——语言转换
统计语言模型:用于描述和预测自然语言文本中的词汇或句子出现的概率,但是没办法考虑词与词之间内在的联系且参数空间会出现爆炸式增长的问题。神经语言模型:通过神经网络训练,将每个词都映射到一个较短的词向量上来。将高维映射到低维。通过embedding词嵌入技术捕捉词句之间的语义。Word2Vec技术技术:有两个模型连续词袋模型(CBOW)和跳字模型(Skip-gram),用来将特征压缩,从而将词汇或短语从词汇表映射到向量的实数空间。
2025-04-24 23:49:14
1188
原创 OpenCV 中的角点检测方法详解
在多个方向上灰度变化明显(与平坦区域和边缘不同)。对旋转、光照变化具有一定鲁棒性。Harris角点检测是一种经典的特征点检测方法,适用于角点明显的场景。OpenCV实现简单,但需调整参数(blockSizek等)以获得最佳效果。改进方法:亚像素优化、Shi-Tomasi算法可提高精度。应用广泛:相机标定、SLAM、图像匹配等。希望这篇博客对你有所帮助!如果有问题,欢迎留言讨论。🚀。
2025-04-23 22:26:30
983
原创 OpenCV中的透视变换方法详解
透视变换(Perspective Transformation)是一种将图像从一个平面投影到另一个平面的变换方式。与仿射变换不同,透视变换能够处理"近大远小"的透视效果,更真实地模拟人眼观察世界的视角变化。这段代码是用来输入图像并将其显示出来本篇博客到这里就结束啦,希望能帮助大家更好的理解和和使用OpenCV中的透视变换方法。其实方法并不难,只要我们能沉下心来慢慢学习,一定会有收获的。我一直坚信,努力会让我们收获一个更好的自己,加油!!!
2025-04-22 22:45:06
1467
原创 OpenCV中的图像旋转方法详解
OpenCV作为最流行的计算机视觉库之一,提供了多种实现图像旋转的方法。本文将详细介绍OpenCV中的各种旋转技术,帮助读者理解它们的原理、适用场景以及具体实现方法。OpenCV提供了丰富而强大的图像旋转功能,理解这些方法的原理和适用场景,可以帮助我们在实际应用中选择最合适的旋转策略,平衡速度和质量需求。希望本文能帮助您更好地理解和使用OpenCV中的旋转方法。在实际应用中,建议根据具体需求选择合适的方法,并通过实验调整参数以获得最佳效果。这段代码与上面所表示的代码实现的功能是一样的。
2025-04-21 20:51:18
769
原创 OpenCV 模板与多个对象匹配方法详解(继OpenCV 模板匹配方法详解)
上文《OpenCV 模板匹配方法详解》我们详细介绍了模板匹配这一方法,本文我们来介绍一下模板与多个对象匹配的方法。最近一直在坚持每天写博客,当作是一个叙说心得的地方,在这个过程中自己通过不断的回顾之前所学习的内容,发现很多细节地方之前都没有注意到,通过再一次的回顾,增添了很多收获,这真的就是“温故而知新”这句话现实化了。最后,希望大家能一直朝着自己理想的方向努力。越努力,越幸运!!!
2025-04-20 22:47:51
1136
原创 卷积神经网络(CNN)详解
卷积神经网络是多层感知机 (MLP)的变种,由生物学家休博尔和维瑟尔在早期关于猫视觉皮层的研究发展而来,视觉皮层的细胞存在一个复杂的构造,这些细胞对视觉输入空间的子区域非常敏感,称之为感受野。CNN由纽约大学的Yann Lecun(杨立昆)于1998年提出(LeNet-5),其本质是一个多层感知机,成功的原因在于其所采用的局部连接和权值共享的方式:一方面减少了权值的数量使得网络易于优化;另一方面降低了模型的复杂度、减小了过拟合 的风险。当网络的输入为图像时,这些优点将表现地更加明显。2006年,
2025-04-19 17:05:47
5039
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人