- 博客(22)
- 收藏
- 关注
原创 0014机器学习案例一电信客户流失预测
电信客户流失预测案例摘要 本案例基于7043条电信用户数据,通过机器学习预测客户流失情况。数据集包含用户基本信息、业务开通情况和合约信息等21个特征。分析重点聚焦于召回率指标,旨在尽可能识别潜在流失客户。研究流程包括数据预处理、可视化分析、特征工程和模型训练。通过EDA发现关键影响因素如合约类型、月费用等,并采用标准化、独热编码等方法处理特征。针对样本不均衡问题,使用SMOTE过采样技术优化数据集。最终通过K折交叉验证评估模型性能,为电信运营商提供客户保留策略支持。
2025-12-06 19:30:00
402
原创 0013机器学习聚类算法(无监督算法)
机器学习聚类算法摘要 聚类是一种无监督学习技术,通过将相似数据对象聚集到同一簇中,同时最大化不同簇之间的差异性。K-means是最常用的聚类算法之一,其思想简单但效果显著,广泛应用于市场划分、机器视觉等领域。K-means通过迭代优化聚类中心位置实现数据分组,但存在需要预先确定K值和初始中心敏感的问题。肘方法通过观察不同K值下误差平方和的变化趋势来确定最佳聚类数,而K-means++算法改进了初始中心选择方式。实际应用中,K-means可用于鸢尾花数据集等分类任务,通过轮廓系数等指标评估聚类效果。
2025-12-05 20:45:00
1016
原创 0012机器学习KNN算法
KNN算法是一种基于邻近样本的机器学习方法,通过计算待测样本与训练集中k个最近邻的距离进行分类或回归预测。其核心三要素包括:k值选择(影响模型复杂度)、距离度量(常用欧氏距离)和决策规则(分类用多数表决,回归用平均值)。算法实现简单但效率较低,针对大数据集可采用KD树优化。文中通过Python代码演示了KNN在电影分类和鸢尾花数据集上的应用,并分析了蛮力计算和KD树两种实现方式的优缺点。该算法直观易懂,但需注意k值选择和计算效率问题。
2025-12-04 18:45:00
757
原创 0011机器学习特征工程
本文系统介绍了机器学习特征工程的关键内容,包括特征工程在机器学习流程中的重要性、数据处理方法和降维技术。主要内容涵盖:1)特征工程的核心作用是通过数据预处理提升模型效果,包括异常值处理、数据平衡、文本向量化等;2)详细讲解了数据清洗、缺失值填充、标准化/归一化、One-Hot编码等基础处理方法;3)重点阐述了文本特征提取技术(词袋法、TF-IDF)和降维方法(特征选择、PCA、LDA)。文章强调特征工程需结合业务场景进行特征衍生和优化,占整个开发流程30%-50%的工作量,是机器学习项目成功的关键环节。
2025-12-03 17:31:48
775
原创 0010集成学习(Ensemble Learning)
集成学习是一种通过组合多个弱学习器来提升预测性能的机器学习方法。主要包括三种类型:Bagging(并行训练多个模型,如随机森林)、Boosting(串行训练模型逐步修正错误,如XGBoost)和Stacking(用基础模型输出训练元模型)。Bagging通过有放回抽样生成多个数据集训练不同模型,最终通过投票或平均得到结果。随机森林是Bagging的扩展,在决策树训练时还随机选择特征子集。代码演示了如何使用决策树桩实现Bagging回归,并通过随机森林分类器展示管道构建、PCA降维和网格调参的应用。集成学习能
2025-12-01 19:00:00
677
原创 ubuntu20.04系统下安装SlowFast行为检测项目并跑通训练
本文详细介绍了在Ubuntu 20.04系统下安装SlowFast行为检测项目并完成训练的全过程。主要内容包括:1)从GitHub下载SlowFast和detectron2源码;2)配置Python 3.10环境并安装PyTorch(CUDA 12.6)及其他依赖项;3)安装detectron2和SlowFast框架;4)配置环境变量;5)下载预训练模型文件(SLOWFAST_32x2_R101_50_50.pkl)和类别文件。文中提供了详细的安装命令和验证方法,并附有完整的资源下载链接和配置截图,适合在配
2025-11-29 11:44:37
919
原创 0009决策树算法的学习和理解
决策树是一种基于树形结构的分类和回归方法,通过特征划分逐步输出结果。其核心在于选择最优划分特征,通常使用信息熵衡量不确定性,信息增益最大的特征优先作为节点。构建过程包括计算原始数据集信息熵、各特征划分后的条件熵及信息增益,选择增益最大的特征进行分裂。示例代码演示了基于信息熵的节点选择过程,比较了房产、婚姻和收入特征的划分效果。决策树属于贪心算法,仅考虑当前最优划分,常见算法包括ID3、C4.5和CART。该模型直观易解释,适合处理有监督学习任务。
2025-11-18 18:16:46
869
原创 0008朴素贝叶斯算法的学习与理解
本文介绍了朴素贝叶斯算法的核心原理与实现。文章首先阐述了贝叶斯公式的基本概念,包括先验概率、后验概率及其推导过程,并通过邮件分类等实例说明其计算过程。随后详细推导了朴素贝叶斯算法,包括特征条件独立性假设下的公式表达。针对不同类型数据,文章介绍了三种变体:高斯朴素贝叶斯(处理连续特征)、伯努利朴素贝叶斯(处理二元特征)和多项式朴素贝叶斯(处理离散计数特征),并给出了具体计算公式和示例。最后展示了在鸢尾花数据集上的代码实现框架,包括数据预处理和模型训练流程。朴素贝叶斯算法凭借其简单高效的特点,在文本分类等问题中
2025-11-15 20:00:00
881
原创 0007SVM算法学习与理解
本文介绍了支持向量机(SVM)算法的核心思想及应用。SVM通过寻找最优分割超平面实现分类,具有强大的泛化能力。文章详细阐述了SVM的推导过程,包括分割超平面、支持向量和间隔等概念,并比较了硬间隔与软间隔模型。为解决非线性问题,重点讲解了核函数的作用及常用类型(多项式、高斯、Sigmoid等)。最后通过鸢尾花数据集演示了不同核函数的SVM实现,比较了各模型的训练时间和准确率。实验表明SVM在分类任务中表现优异,核函数的选择对性能有重要影响。
2025-11-14 15:40:39
877
原创 0006Logistic回归算法的学习和理解
Logistic回归是一种用于二分类问题的经典算法,通过Sigmoid函数将线性回归结果映射到(0,1)区间表示概率。文章详细介绍了算法原理,包括决策边界寻找、损失函数推导(从点到线距离公式出发),并解释了梯度下降的优化方法。针对多分类问题,介绍了OVO和OVR两种策略以及Softmax回归算法。最后通过乳腺癌数据集实例,展示了使用sklearn实现Logistic回归的完整流程,包括数据处理、模型训练和参数说明,特别强调了正则化参数penalty和优化器solver的选择对模型的影响。
2025-11-11 13:28:17
392
原创 0005机器学习线性回归问题的深入学习与理解
本文系统讲解了线性回归问题的原理与实现方法。首先介绍了一元、二元及多元线性回归的定义和数学表达式,分别对应直线、平面和超平面的拟合问题。接着详细推导了线性回归的解析解法,通过最小二乘法求解参数,并给出三元线性回归的示例推导过程。然后介绍了机器学习开发标准流程的10个步骤。最后通过Python代码实现了线性回归类,包含训练、预测、评估和模型保存/加载功能,支持截距项选择,可计算MSE、R²和MAE指标。代码采用矩阵运算提高效率,注释详细,便于理解核心数学原理与编程实现。
2025-11-08 16:33:13
1136
原创 0004损失函数、梯度下降和模型性能评估概述
本文概述了机器学习中的核心概念:损失函数、梯度下降和模型性能评估。首先介绍了损失函数的概念及其在模型训练中的核心作用,详细阐述了均方误差(MSE)、平均绝对误差(MAE)和交叉熵损失(Cross-Entropy)三种常见损失函数的特性与适用场景。其次探讨了损失函数与梯度下降算法的关系,说明了梯度下降如何利用损失函数的梯度信息进行参数优化。最后通过一元二次函数的例子,展示了梯度下降算法的具体实现过程,包括梯度计算、学习率调整和参数更新。这些内容构成了机器学习模型训练的基础知识框架,为理解模型优化过程提供了理论
2025-11-01 14:06:19
1239
原创 0003几种数据特征归一化方法
本文介绍了五种常见的数据特征归一化方法。min-max标准化将特征值线性映射到[0,1]区间,适用于均匀分布但易受异常值影响。Z-score标准化转换均值为0、标准差1的正态分布,适用于近似正态分布的数据。Max-Abs归一化将特征值除以最大值映射到[-1,1],适合稀疏数据。Robust标准化基于中位数和四分位距,对异常值鲁棒性强。L1/L2范数归一化将特征向量单位化,常用于文本分类和聚类。文章通过具体代码示例演示了min-max和Z-score两种方法的应用,并总结了不同场景下的方法选择建议:无异常值用
2025-10-29 10:26:27
915
原创 0002机器学习虚拟环境的安装
本文详细介绍了在Windows10系统下使用Anaconda搭建机器学习开发环境的完整流程。主要内容包括:1)通过conda命令创建名为ml的Python3.9虚拟环境;2)验证环境创建成功并学会环境管理命令;3)在ml环境下安装Jupyter Notebook;4)使用清华镜像源安装numpy、pandas、matplotlib和scikit-learn等机器学习常用包;5)配置VSCode的Python解释器指向新建的ml环境。文章配有详细的操作截图,为机器学习初学者提供了清晰的环境搭建指南,最终完成了
2025-10-27 17:40:21
446
原创 0001人工智能与机器学习的基本概念和方法
本文介绍了人工智能与机器学习的基本概念和核心方法。主要内容包括:1)人工智能的分类(弱AI和强AI)及机器学习作为其主流技术;2)机器学习的三大实现方法:监督学习、无监督学习和半监督学习;3)数据集的基本组成(样本、特征和标签);4)机器学习的核心任务分类与回归;5)数据集的划分(训练集、验证集和测试集);6)机器学习中常用的距离计算方法。文章系统梳理了机器学习的基础知识和关键概念,为理解人工智能技术提供了清晰的框架。
2025-10-27 17:29:41
1402
原创 零基础网页开发
本文介绍了网页开发的基础知识,主要包括HTML、CSS和JavaScript三大部分。HTML作为网页结构骨架,通过标签定义内容组织;CSS负责网页样式设计,控制颜色、布局等外观;JavaScript则实现网页交互功能。文章详细讲解了HTML常用标签(如标题、段落、图片、表单等)的使用方法,以及CSS如何通过类名和ID控制样式。同时提供了VSCode开发环境和Live Server插件的配置指南,帮助初学者快速搭建网页开发环境。通过具体代码示例,展示了如何创建基础网页元素并设置样式,为零基础学习者提供了清晰
2025-10-24 09:02:15
1010
原创 C# Winform框架视觉程序中,如何用多态方法实现对海康和Basler相机的调用
本文介绍了一种基于C#多态方法实现海康和Basler相机调用的统一框架方案。通过抽象基类MyBaseCamera封装相机共性功能,并分别派生出MyHKCamera和MyBaslerCamera具体实现类,有效解决了不同品牌相机SDK差异带来的代码耦合问题。方案采用"软/硬触发+回调函数"的异步采集模式,支持与康耐视VisionPro等视觉算法库的无缝对接,实现了上层调用无感知、底层替换低成本的开发目标。实践表明,该设计显著提升了工业视觉项目的代码复用性和扩展性,为多品牌相机协同工作提供了
2025-08-29 14:33:06
1292
原创 工业视觉系统硬件选型实战:从相机、镜头到光源的精准搭配法则
工业视觉系统硬件选型实战指南 本文系统介绍了工业视觉检测系统中相机、镜头和光源的选型原则与技术要点。重点解析了海康和Basler两大品牌工业相机的型号命名规则及性能参数,通过具体型号对比不同相机的分辨率、帧率等核心指标。内容涵盖面阵与线阵相机的区别、选型计算方法,以及不同应用场景下的设备搭配建议。文中提供了详细的参数对照表,帮助读者根据检测精度、速度等实际需求,选择适合的相机型号和配套光学组件,为工业视觉系统的硬件配置提供实用参考。
2025-08-26 22:45:00
2678
原创 windows系统安装pylon Viewer,连接Basler工业视觉相机
本文介绍了在Windows系统下安装pylon Viewer软件并连接Basler工业相机的完整步骤:1)双击安装软件,选择网口连接功能;2)通过网线连接相机与电脑,使用IP Configurator设置相机IP;3)打开pylon Viewer连接相机,进行单次拍照和图像保存操作。特别提醒:误操作自动对焦可能导致报错,需恢复默认设置。整个过程配有详细图文说明,帮助用户快速完成相机配置与图像采集。(149字)
2025-08-23 16:49:44
759
原创 如何用Window电脑配置pytorch GPU训练环境,标注数据并跑通yolo11训练
本文详细介绍了在Windows电脑上配置PyTorch GPU训练环境并运行YOLOv11训练的完整流程。主要内容包括:1)安装Anaconda和PyTorch(需匹配CUDA版本);2)使用Labelme和X-AnyLabeling工具标注目标检测、实例分割和旋转目标检测数据;3)将标注数据转换为YOLO格式并划分数据集;4)在VSCode中配置YOLOv11训练环境,修改yaml文件后启动训练。教程提供了完整的代码执行流程和关键截图,适用于计算机视觉初学者搭建目标检测训练环境。
2025-08-21 12:08:24
1941
2
开箱即用海康 + Basler 相机 C# 封装库 - 已集成触发 / 参数配置 / 图像回调
2025-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅