- 博客(84)
- 收藏
- 关注
原创 YOLOv3:目标检测领域的经典之作
YOLOv3 通过先验框、网络结构、分类器的多维度改进,在目标检测的速度和精度上都有出色表现,成为经典算法,为后续 YOLO 系列及其他目标检测算法发展提供了重要参考思路。
2025-10-15 19:42:13
471
原创 Pandas:机器学习数据处理的核心利器
从数据加载到特征工程,Pandas 以其简洁的 API 和高效的性能,成为了机器学习数据处理环节的 “瑞士军刀”。它不仅能快速解决缺失值、异常值等基础问题,还能支持复杂的特征衍生和筛选,为模型训练提供高质量的数据输入。在实际项目中,Pandas 往往与NumPy(数值计算)、Matplotlib/Seaborn(数据可视化)和scikit-learn(模型训练)协同工作,共同构成机器学习的完整技术栈。
2025-10-11 20:14:12
1454
1
原创 YOLO 目标检测算法全解析:原理、分类与性能指标
YOLO(You Only Look Once)是由 Joseph Redmon 等人于 2016 年提出的基于深度学习的目标检测算法。它的核心思想是将目标检测问题转化为回归问题,通过一个神经网络直接预测目标的类别和位置。YOLO 算法把输入图像分成 S*S 个网格,每个网格负责预测该网格内是否存在目标,以及目标的类别和位置信息。而且,YOLO 还采用多尺度特征融合技术,能在不同尺度下检测目标。
2025-10-11 20:06:34
957
原创 用 OpenCV 轻松实现图像风格迁移:从代码到实践全解析
在数字图像处理领域,图像风格迁移一直是热门方向 —— 它能让普通照片瞬间拥有艺术大师的笔触,比如将风景照转化为梵高《星月夜》的漩涡质感。今天就带大家用 OpenCV 实现这一功能,从代码拆解到实际运行,手把手教你打造自己的风格迁移工具。。
2025-10-10 09:03:53
1078
原创 用 BP 神经网络预测公路运量:从原理到实战全流程
在交通规划与运输企业运营中,精准预测公路客运量和货运量是制定决策的关键。本文以安庆师范大学智能控制基础实验为背景,手把手教你用 BP 神经网络实现公路运量预测,涵盖数据预处理、模型搭建、训练测试到最终预测的全流程,代码可直接复用,新手也能轻松上手。
2025-10-09 19:12:58
423
原创 PyTorch 模型部署实战:用 Flask 搭图像分类 API
predict(处理图片预测)和/health(服务健康检查)。/predict 接口:接收 POST 请求,处理图片上传、预测和结果返回:# 初始化响应字典(默认失败)# 检查请求方法和是否包含图片# 1. 读取图片:从请求中获取二进制图片数据,转为PIL图像image = Image.open(io.BytesIO(image_bytes)).convert('RGB') # 确保为RGB格式# 2. 预处理图片# 3. 模型预测(禁用梯度计算,提升速度)
2025-10-09 19:04:17
849
原创 用 Python+OpenCV 实现实时文档扫描:从摄像头捕捉到透视矫正全流程
本文从原理到代码,详细拆解了基于 Python+OpenCV 的实时文档扫描工具。核心是通过 “图像预处理→轮廓检测→透视矫正→二值化” 四步,将摄像头捕捉的文档转为清晰的电子扫描件。用排序文档四角,为透视变换打基础;用实现倾斜文档矫正,是扫描效果的核心;通过轮廓面积和边数筛选文档,确保检测准确性。如果你在实践中遇到 “文档检测不到”“扫描件模糊” 等问题,可尝试调整边缘检测阈值或面积阈值,也欢迎在评论区交流讨论!要不要我帮你整理一份实时文档扫描工具的参数调优指南?
2025-10-07 11:00:09
1217
3
原创 从零开始构建中文语料词汇表:基于 Python 的实践指南
词汇表的作用,就是给每一个独一无二的字符(或词语)分配一个唯一的数字索引(比如 “今” 对应 0,“天” 对应 1),将文本转化为数字序列。同时,它还能解决两个关键问题:。今天我们从 “为什么需要词汇表” 出发,详细解析了基于中文语料构建词汇表的 Python 代码,涵盖了从数据读取、频率统计、低频过滤到词汇表保存的全流程,还给出了后续文本转序列的示例。这个函数的输出,就是可以直接输入 LSTM、CNN 等 NLP 模型的数字序列 —— 至此,你就完成了 “文本→词汇表→数字序列” 的完整流程。
2025-10-07 10:53:05
1121
原创 基于 dlib+OpenCV 的人脸检测与 68 关键点定位实你nmnmj战教程
本文从环境搭建到实战案例,逐步讲解了 dlib+OpenCV 实现人脸检测与关键点定位的完整流程。环境配置时,优先选择兼容性好的版本(dlib 19.22.1、NumPy 1.26.4),避免编译错误;人脸检测的核心是 dlib 的 HOG 检测器,上采样次数需平衡检测精度与速度;68 关键点定位依赖预训练模型,关键点序号是后续应用的基础;自定义函数(如drawLine)可灵活扩展功能,满足不同场景需求。
2025-09-25 20:30:00
894
原创 dlib 实战:人脸检测、关键点定位与疲劳检测的全流程实现
本文详细介绍了基于 dlib 库的人脸检测、人脸关键点定位以及疲劳检测的原理与代码实现。从基础的人脸检测,到精准的关键点定位,再到利用关键点信息进行人脸特征绘制和疲劳检测,展示了 dlib 在人脸分析领域的强大能力。这些技术可以应用在驾驶员监控、学员上课状态检测等多个实际场景中,具有广泛的应用前景。
2025-09-25 19:58:26
1197
原创 RNN 与 LSTM:解密序列数据的 “记忆大师”
RNN 开启了序列数据建模的大门,解决了传统神经网络无法处理顺序依赖的问题,但受限于长期依赖学习能力。LSTM 作为 RNN 的进阶,通过门结构巧妙地控制信息的留存与遗忘,突破了长期依赖的瓶颈,成为处理长序列数据的有力工具。在实际应用中,需根据序列长度、任务需求等因素选择合适的模型,让这些 “记忆大师” 更好地为序列数据建模服务。
2025-09-23 20:26:38
852
原创 数据预处理全指南:从文本、图像到表格,附实战代码与最佳实践
数据预处理不是 “一次性操作”,而是需要根据数据类型、模型目标动态调整的过程。数据探索先行:不了解数据分布就处理,容易导致 “越处理越糟”;管道化封装:用将预处理步骤串联,避免数据泄露;可视化验证:关键步骤(如图像拼接、异常值检测)需可视化确认效果;参数调优:如 Canny 边缘检测的阈值、TF-IDF 的最大特征数,需结合业务调整。掌握这些方法后,你将能应对 90% 以上的数据预处理场景,为后续建模打下坚实基础。
2025-09-23 20:05:10
1089
原创 从图片到实时摄像头:OpenCV EigenFace 人脸识别实战教程
在计算机视觉领域,人脸识别是一个兼具趣味性与实用性的技术方向。借助 OpenCV 库提供的 EigenFace 算法,我们无需深入理解复杂的机器学习理论,就能快速搭建起从静态图片识别到实时摄像头识别的完整流程。本文将通过三段递进式代码,带大家逐步掌握人脸识别技术,从基础原理到实际应用,手把手教你实现属于自己的人脸识别系统。
2025-09-22 19:17:03
1384
原创 轻量级大模型对话开发:Qwen2.5-1.5B-Instruct 调用指南,小白也能上手
环境配置与模型获取:安装和torch,获取本地模型路径。关键代码解析:Tokenizer 与模型加载、多轮输入构造、生成参数控制、结果解码。常见错误修复:针对参数名错误、变量名错误、拼写错误等入门坑提供解决方案。通过本文的代码和讲解,即使是大模型开发新手,也能快速实现轻量级开源模型的多轮对话功能。后续可基于此框架,扩展到客服对话、知识问答等更多场景,进一步探索大模型的应用价值。
2025-09-22 09:28:46
1243
原创 OpenCV 实战:轻松实现摄像头人脸识别与微笑检测
通过本文的两段代码,我们不仅掌握了 OpenCV 的基本使用方法,还理解了人脸识别与微笑检测的核心逻辑 —— 从图像预处理(灰度化)到模型调用(分类器检测),再到结果可视化(标注与显示)。整个过程不需要复杂的数学知识,只要跟着步骤一步步调试,即使是编程新手也能快速实现功能。计算机视觉的世界还有很多有趣的技术等待探索,比如目标跟踪、图像分割、物体识别等。希望本文能成为大家入门的起点,未来开发出更多有创意的应用!如果在实践过程中遇到问题,欢迎在评论区留言讨论,我们一起解决~
2025-09-19 09:10:18
1154
原创 基于 OpenCV 实现实时文档扫描:从轮廓检测到透视变换全流程解析
在日常工作与学习中,我们经常需要将纸质文档转化为电子版本。虽然手机端有许多扫描 APP,但了解其背后的技术原理,并使用 OpenCV 手动实现一个实时文档扫描工具,不仅能加深对计算机视觉的理解,还能根据需求灵活定制功能。本文将详细讲解如何基于 Python 和 OpenCV 构建实时文档扫描系统,涵盖图像预处理、轮廓检测、透视变换、二值化等核心步骤。
2025-09-15 19:22:09
1266
1
原创 OpenCV 实战:答题卡识别与自动批改全流程,从图像到分数一步到位
本文通过 OpenCV 实现了选择题自动批改的全流程,核心是利用 “轮廓检测” 定位关键区域、“透视变换” 矫正图像、“像素统计” 识别答案。该方案不仅能减少人工批改的工作量,还能保证批改的一致性和准确性。对于初学者,建议从 “图像预处理” 和 “轮廓检测” 入手,逐步理解每个步骤的作用;对于实际应用,需根据试卷的具体格式调整参数,必要时增加抗干扰逻辑,以提高系统的稳定性。
2025-09-13 21:00:00
974
原创 详解 OpenCV 形态学操作:从基础到实战(腐蚀、膨胀、开运算、闭运算、梯度、顶帽与黑帽)
操作名称核心逻辑核心作用典型应用场景腐蚀(Erosion)结构元素啃食前景边缘缩小前景、去亮噪声、断连接指纹去噪、文字细化膨胀(Dilation)结构元素扩张前景边缘扩大前景、补暗孔洞、连间断文字加粗、孔洞填补开运算(Opening)腐蚀 + 膨胀去亮噪声、平滑轮廓、断连接车牌去噪、遥感图像小亮点消除闭运算(Closing)膨胀 + 腐蚀补暗孔洞、平滑轮廓、连间断零件图像孔洞填补、指纹断纹连接梯度运算膨胀结果 - 腐蚀结果提取前景边缘、轮廓检测。
2025-09-13 09:20:29
1266
原创 基于 OpenCV 与 SIFT 算法的指纹识别系统实现:从匹配到可视化
本文基于 OpenCV 与 SIFT 算法,实现了一套从 “特征提取→匹配计算→结果可视化” 的完整指纹识别系统。该系统逻辑清晰、代码可复用性强,不仅能完成基础的指纹识别功能,还通过匹配点标记实现了结果的直观展示。通过调整关键参数、增加图像预处理步骤,可进一步提升系统的鲁棒性,适用于小型指纹识别场景(如家庭安防、实验室考勤)。若需应用于大规模场景(如企业级考勤),可结合数据库(如 MySQL)存储用户信息,并优化匹配算法(如引入 KD 树加速特征检索),提升系统效率。
2025-09-12 19:23:34
1142
原创 OpenCV 轮廓检测完全指南:从基础到实战
在计算机视觉领域,轮廓检测是一项核心且基础的技术,它能够帮助我们识别图像中物体的边界形状,为后续的目标识别、图像分割、尺寸测量等高级任务提供关键支撑。本文将基于 OpenCV 库,从理论知识到代码实战,全面讲解轮廓检测的原理、API 使用方法以及常见应用场景,即使是 OpenCV 初学者也能轻松理解并上手实践。
2025-09-12 09:10:19
1035
原创 Python 实战:票据图像自动矫正技术拆解与落地教程
本文将从技术原理到代码实现,手把手教你用 Python 打造票据图像自动矫正工具,解决实际场景中的图像预处理难题。整体技术流程可简化为:图像读取→预处理(缩放 / 灰度化 / 二值化)→轮廓检测与筛选→透视变换矫正→结果输出,最终将倾斜、变形的票据转化为平整的标准矩形图像。票据矫正的 “核心引擎”,通过透视变换矩阵将倾斜的四边形(票据)映射为标准矩形,实现 “从倾斜到平整” 的关键一步。完成核心函数定义后,通过主流程代码将各环节串联,实现从 “读取图像” 到 “保存结果” 的完整闭环,步骤如下:。
2025-09-11 20:24:47
1192
原创 OpenCV 边缘检测实战:从 Sobel 到 Canny 的完整指南
x 方向边缘:主要显示 “垂直轮廓”(如物体的左右边缘);y 方向边缘:主要显示 “水平轮廓”(如物体的上下边缘);融合后边缘:完整呈现物体的整体轮廓,细节更丰富。通过本文的实战,你已经掌握了 OpenCV 中四种核心边缘检测算法的使用 —— 从 “分方向” 的 Sobel/Scharr,到 “无方向” 的 Laplacian,再到 “智能筛选” 的 Canny,每种算法都有其独特的适用场景。
2025-09-11 09:03:59
1450
原创 机器学习实战(二):Pandas 特征工程与模型协同进阶
在上一篇中,我们通过 Pandas 完成了机器学习的 “数据清洗” 环节 —— 从加载数据到处理缺失值、去重筛选,得到了 “干净” 的原始数据。但 “干净数据” 不等于 “可用特征”,机器学习模型真正需要的是。本文作为系列第二篇,将聚焦 Pandas 在与中的核心应用,从特征提取、转换、选择,到与 Scikit-learn 模型对接、预测结果分析,帮你打通从 “数据” 到 “模型” 的关键链路。
2025-09-10 19:02:34
1259
原创 机器学习实战(一):Pandas 数据处理基础与预处理核心应用
在机器学习工作流中,“数据决定上限,模型逼近上限”,而 Pandas 作为 Python 数据分析生态的核心库,正是把控数据质量、挖掘数据价值的关键工具。本文作为系列第一篇,将聚焦 Pandas 在机器学习中的与核心能力,结合实际代码案例,从数据加载、探索分析到筛选去重、缺失值处理,帮你搭建从原始数据到有效样本的第一座桥梁。
2025-09-10 18:45:00
1224
原创 OpenCV 图像处理实战:从图像金字塔到直方图分析
图像金字塔:下采样(缩小 + 平滑)、上采样(放大 + 填充),以及拉普拉斯金字塔(提取残差,用于复原);直方图分析:灰度图 / 彩色图的直方图计算,两种工具(Matplotlib/OpenCV)的对比;掩码操作:通过二进制掩码选择区域,结合直方图实现精准的区域分析。希望本文能帮助大家快速上手这些实用技术,后续可结合具体场景(如人脸识别、目标检测)进一步深化应用!
2025-09-09 19:17:47
1399
原创 OpenCV 实战:多角度模板匹配实现图像目标精准定位
在计算机视觉领域,模板匹配是一种基础且实用的目标检测技术,它通过在待检测图像中寻找与模板图像相似的区域,实现目标的定位与识别。在实际应用中,可根据需求进一步优化(如添加非极大值抑制、多尺度匹配),或与其他技术(如边缘检测、形态学操作)结合,提升目标定位的精度和鲁棒性。本文实现的多角度模板匹配代码,基于 OpenCV 和 NumPy 库,通过归一化相关系数算法实现精准匹配,并结合模板旋转解决目标角度变化的问题。当多个匹配区域重叠时,会导致重复绘制矩形框,可通过非极大值抑制(NMS)解决:。
2025-09-09 19:09:18
1038
2
原创 基于 OpenCV 的信用卡数字识别:从原理到实现
本项目的核心目标是从信用卡图像中自动提取数字区域,识别出具体数字,并根据卡号的第一位数字判断信用卡类型(如 Visa、MasterCard 等)。模板图像处理:创建 0-9 数字的模板库信用卡图像预处理:增强数字区域特征数字区域提取:定位信用卡上的 4 组数字模板匹配识别:对比模板库识别具体数字并判断卡类型"""图像显示函数,显示后按任意键关闭窗口""""""轮廓排序函数,支持四种排序方式"""i = 0# 处理反向排序(从右到左或从下到上)# 处理垂直方向排序(从上到下或从下到上)
2025-09-08 19:32:35
1984
2
原创 Matlab:基于遗传算法优化 PID 控制器的完整实现与解析
首先清空工作空间、关闭图形窗口,定义被控对象的传递函数。本文以典型二阶系统为例,传递函数为% 遗传算法优化PID控制器clear all;% 清空工作空间变量close all;% 关闭所有图形窗口clc;% 清空命令行窗口% 被控对象传递函数:G(s) = 400/(s² + 50s)num = 400;% 分子多项式系数% 分母多项式系数(s² + 50s + 0)% 创建传递函数模型。
2025-09-07 21:35:57
1406
原创 PyTorch 实战:从零搭建 CBOW 模型,轻松生成高质量词向量
模型通过学习这种上下文与目标词之间的关系,最终得到每个词语对应的词向量。这里选择上下文['People', 'create', 'to', 'direct'],将其转换为上下文向量并输入到模型中,模型会输出每个单词作为目标词的对数概率,我们通过argmax(1)获取概率最大的单词对应的索引,从而得到模型预测的目标词。在每一轮训练中,遍历所有训练数据,进行前向传播计算损失,然后通过反向传播更新模型参数,并累加每一轮的总损失,最后将总损失添加到losses列表中,以便后续观察损失变化情况。
2025-09-07 19:13:49
936
原创 深度学习实战:图像数据增强如何拯救你的 CNN 模型?从代码到原理全解析
数据增强不是 “可选操作”,而是深度学习图像任务的 “基础工程”。它不需要你增加额外的数据标注成本,却能有效解决过拟合、提升模型泛化能力,让你的 CNN 模型在真实场景中 “更能打”
2025-09-05 19:34:36
1110
原创 ResNet 迁移学习---加速深度学习模型训练
迁移学习是一种高效的机器学习策略,它利用已在大规模数据集上训练好的模型,针对新任务进行微调。这种方法不仅能大幅加快模型训练速度,还能显著提升模型性能,即便在新任务数据稀缺时,也能有出色表现。选模型与层:挑选在如 ImageNet 等大规模图像数据集上预训练的模型(像 VGG、ResNet 系列),再依据新数据集特点,确定需微调的层。若任务是边缘检测这类低级特征提取,浅层模型层更合适;若是分类这类高级特征任务,则选更深层模型。冻预训练参数。
2025-09-05 19:14:22
1154
原创 用遗传算法破解一元函数最大值问题:从原理到 MATLAB 实现
本文通过 MATLAB 实现了遗传算法求解一元复杂函数的最大值,从原理到代码逐步拆解,清晰展示了遗传算法 “选择 - 交叉 - 变异” 的核心逻辑。相比传统优化方法,遗传算法无需依赖函数的连续性和可导性,只需通过 “适应度” 评估解的优劣,就能在复杂解空间中高效搜索全局最优解。除了一元函数,遗传算法还可扩展到多元函数优化、组合优化(如旅行商问题)、机器学习参数调优等领域。只要掌握了 “编码 - 适应度 - 进化操作” 的核心框架,就能将其应用到更多实际问题中。
2025-09-04 20:10:32
882
原创 ResNet 深度拆解:破解深度学习 “梯度消失” 难题
定义残差块,体现残差结构核心# 第一个卷积,用于调整通道数和特征self.bn1 = nn.BatchNorm2d(out_channels) # 标准化,防止过拟合# 第二个卷积self.bn2 = nn.BatchNorm2d(out_channels) # 标准化# shortcut连接,当输入输出通道或尺寸不一致时,用1×1卷积调整if stride!residual = x # 跨层连接,保留原始信息。
2025-09-04 19:29:56
997
原创 深度学习---pytorch卷积神经网络保存和使用最优模型
1. 设备配置:优先使用 GPU(cuda),无 GPU 则用 CPUprint(f'使用设备: {device}')# 2. 初始化网络并加载参数model = CNN().to(device) # 实例化网络并移动到指定设备model.load_state_dict(torch.load("best_params.pth")) # 加载权重参数model.eval() # 切换为评估模式:关闭 dropout、固定 BatchNorm 参数# 直接加载完整模型,无需提前定义 CNN 类。
2025-09-03 19:37:56
1227
原创 粒子群算法 (PSO) 优化 PID 控制:水温恒定控制仿真实验详解
在工业控制领域,PID 控制器因结构简单、鲁棒性强、易于实现等优点,被广泛应用于温度、压力、流量等过程控制场景。但传统 PID 参数整定(如经验法、Ziegler-Nichols 法)往往依赖工程师经验,难以获得最优控制效果。本文将通过,对比常规 PID 与粒子群算法(PSO)优化 PID 的控制性能,带大家深入理解智能优化算法在 PID 参数整定中的应用。
2025-09-03 09:37:15
1170
原创 用 PyTorch 实现食品图像分类:从数据预处理到模型训练与预测
PyTorch 提供了Dataset抽象类,我们通过继承该类,实现自定义的食品图像数据集,支持图像读取、数据增强与标签处理。为了提升模型泛化能力并统一输入格式,我们对训练集和验证集(测试集)分别定义数据变换操作,主要包括图像尺寸调整和张量转换。
2025-09-02 19:03:50
948
1
原创 用 MATLAB 打造交互式动物识别系统:从代码解析到逻辑设计
用户输入的有效性是系统稳定运行的关键 —— 需要确保用户回答 “是 / 否” 时不输入其他字符,回答 “腿数” 时不输入负数或字符串。特征筛选函数输入校验函数结果输出函数。
2025-09-02 08:49:59
1235
原创 Linux 定时任务 crontab 完全指南 —— 让服务器自动干活,解放双手
crontab是 Linux 运维中 “自动化” 的核心工具,无论是简单的时间同步,还是复杂的定时备份,都能通过它高效实现。掌握 “时间表达式规则 + 核心操作命令 + 避坑细节”,就能让服务器按你的需求自动干活,极大减少重复操作。建议刚开始配置时,先从简单任务入手(如每 10 分钟执行一次date命令并输出到日志),验证任务能正常执行后,再逐步应用到实际场景中。如果遇到问题,可通过查看日志文件(如,系统级 cron 日志)或重定向的任务日志,快速定位原因。希望本文能帮你彻底搞懂crontab。
2025-09-01 19:30:00
1658
原创 Linux 包管理利器 yum 详解 —— 从基础操作到国内源替换,新手也能轻松上手
在 Linux 系统运维与日常使用中,软件的安装、更新与卸载是高频操作。而yum(Yellowdog Updater, Modified)作为 CentOS、RHEL 等系统的默认包管理工具,凭借自动解决依赖的优势,成为了用户管理软件的 “得力助手”。本文将从yum基础用法入手,逐步讲解核心操作与换源技巧,帮你彻底掌握这个实用工具。
2025-09-01 19:00:00
797
原创 用 MATLAB 实现遗传算法求解一元函数极值:从代码到实践
遗传算法求解一元函数极值 - 完整实现% 包含两个函数的优化:% 清空工作区并关闭所有图形窗口clear all;close all;clc;% 显示菜单disp('=== 遗传算法求解一元函数极值 ===');disp('请选择要优化的函数:');choice = input('请输入选择(1或2): ');% 设置遗传算法参数% 种群大小% 染色体长度% 最大进化代数% 交叉概率% 变异概率% 保留的精英个体数量% 根据选择设置函数和区间。
2025-08-31 19:15:01
1467
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅