
机器学习
文章平均质量分 89
机器学习专栏
橙子小哥的代码世界
这个作者很懒,什么都没留下…
展开
-
【机器学习】【KMeans聚类分析实战】用户分群聚类详解——SSE、CH 指数、SC全解析,实战电信客户分群案例
本文通过用户分群案例,详细介绍了如何使用 KMeans 聚类算法对客户数据进行分群,并结合 SSE(肘部法)、Calinski-Harabasz 指数和 Silhouette Score 三个指标来判断最佳聚类数 k。文章中提供了完整的 Python 代码,并逐步讲解如何观察绘制的图表,从而确定合适的 k 值。适合对聚类算法和模型评估感兴趣的读者阅读与实践。喜欢的朋友记得点赞、收藏、转发和关注哦!原创 2025-02-23 17:38:24 · 1515 阅读 · 0 评论 -
【机器学习】从 ID3 到 CART:一文看懂决策树核心原理,实战 Titanic 乘客生存预测
本文系统地介绍了三种常见决策树算法(ID3、C4.5、CART)的核心思想与差异,随后结合泰坦尼克号乘客生存预测的实战示例,演示了如何使用 Python(sklearn)搭建并可视化决策树模型。文章提供了详细注释的示例代码,并分析了模型评估指标与可视化结果,为读者理解决策树在分类任务中的应用提供了思路。如果你对决策树或机器学习感兴趣,欢迎点赞、收藏、转发!原创 2025-02-23 16:04:44 · 1064 阅读 · 0 评论 -
【机器学习】【深入浅出】混淆矩阵全解析:搞懂 TP、FP、TN、FN 与分类模型评估!
本文以通俗易懂、幽默风趣的方式详细解析了混淆矩阵的定义、计算方法和实际作用。从二分类的四个核心指标——真正例(TP)、假阳性(FP)、真负例(TN)、假阴性(FN)出发,本文讲解了如何利用混淆矩阵评估模型性能,并进一步衍生出准确率、精确率、召回率和 F1-score 等关键指标。文章还通过医疗诊断等案例,展示了混淆矩阵如何帮助我们区分漏诊与误诊,并给出记忆技巧,助你快速掌握 TFPN 概念。喜欢本文的朋友请点赞、收藏、转发和关注我的博客,共同探索数据科学的魅力!原创 2025-02-21 22:51:02 · 1484 阅读 · 0 评论 -
【机器学习】【数据狂人必看】线性回归太“直”?试试随机森林、梯度提升和XGBoost预测加州房价!
本文用幽默轻松的风格带你了解线性回归的基本原理与局限性,告诉你为何传统“直线救星”有时并不够用;随后通过加州房价数据集的实例,展示如何利用随机森林、梯度提升和XGBoost预测房价。文章中附有详细代码和逐步讲解,帮助你在实际项目中选择合适的模型。如果你觉得文章有趣、实用,请点赞、收藏、转发并关注我的博客,帮助更多人探索数据科学的魅力!原创 2025-02-19 22:11:25 · 1023 阅读 · 0 评论 -
【机器学习】超参数调优指南:交叉验证,网格搜索,混淆矩阵——基于鸢尾花与数字识别案例的深度解析
本篇文章从零开始讲解交叉验证与网格搜索的概念与原理,并结合两个经典案例——鸢尾花分类与手写数字识别,展示如何在真实数据上使用 scikit-learn 的 GridSearchCV 进行 KNN 超参数调优。文章包含详细代码、注释、可视化过程以及模型评估与对比,帮助你快速上手并掌握在机器学习项目中如何寻找最优模型和超参数。赶快点赞、收藏、转发和评论吧!原创 2025-02-18 20:40:28 · 853 阅读 · 0 评论 -
【机器学习】深入浅出KNN算法:原理解析与实践案例分享
本文深入浅出地介绍了 K-最近邻(KNN)算法的基本原理,包括如何通过计算数据点之间的距离来选择最近邻,并根据多数投票(分类)或平均值(回归)的方式进行预测。同时,文章还讨论了 KNN 的优缺点及其在手写识别、推荐系统和医学诊断等领域的应用,并通过 Python 案例展示了如何利用 scikit-learn 库实现 KNN 分类和回归,适合初学者快速入门机器学习实践。原创 2025-02-17 22:53:41 · 1906 阅读 · 0 评论 -
机器学习01 概述(python)
计算机的算法就相当于人类的大脑,人类的能力来自于经验,因此这个经验就是,计算机的历史数据,算法从计算机的历史数据中进行学习,比如训练使用已经知道标注好是猫狗的图片去学习识别猫狗(就是训练模型),训练模型完成后(学会了),那么模型已经学好了之后,就可以用模型去解决旧的问题或者新的问题(模型分类,模型预测,比如识别新的猫狗。一个的神经传递信号,比如摸到了火,很烫,(输入信号),那么人会产生一个缩手的动作(输出信号)神经元:信号传递,堆叠在一起(神经元越多,能力越强,神经元越少,能力越少)原创 2024-09-04 09:24:11 · 665 阅读 · 0 评论 -
机器学习02-KNN算法(python)
Knn: k-近领算法:K 是个数,由算法工程师设计,NN 是邻居, 近邻就是距离的意思,而平面的两点距离就是欧式距离。比如说,你最近的3个邻居的距离。那么k 就是3,NN就是这最近3个邻居。k: 是算法工程师设计的,所以叫做超参数,调参,就是调的超参数。K的建议: 不建议用偶数,不建议超过7,不建议是类别个数的倍数。回归的时候: 判断最近K个最近样本目标的平均值。分类的时候: 判断最近K 个最近样本的类别。原创 2024-09-05 10:39:49 · 209 阅读 · 0 评论 -
机器学习03-线性回归(python)
求: 损失函数最小值的时候,就是那条最优直线 ( K 和 B 从数据中学习的参数 ,如果调优也是计算机学习调优。和超参数这种人工设定是有区别的。3. 那么怎么找到那一条让更多点经过的直线的呢?用偏导数求损失函数 偏导 等于0的时候的 K 和 B。主要是算法去计算斜率和截距,然后使用算法去预测。为什么W是向量,为什么会变成向量呢。2. 已经知道每两个点会有一条直线。3.国内GDP与双十一销售额。2. 昆虫鸣叫次数与天气。损失函数什么时候使用呢?1.钢轨伸缩长度与温度。1. 样本会有多条数据。原创 2024-09-06 15:55:57 · 766 阅读 · 0 评论 -
机器学习04-逻辑回归(python)
它的核心思想是,给定观测到的样本数据,选择最有可能使这些观测结果发生的参数值。在逻辑回归中,概率是用于计算某个事件(例如某个类别)的发生可能性的基础。例如,在预测一个病人是否患病时,模型输出的概率值表示病人患病的可能性。联合概率是指两个或多个随机事件同时发生的概率。在逻辑回归中,Sigmoid 函数的作用是将线性回归的输出结果(一个任意实数)映射到 0 到 1 之间的区间,用来表示预测某个事件发生的概率。对数似然函数的最大值与似然函数的最大值出现在相同的点,但计算对数可以使乘法变成加法,极大地简化计算。原创 2024-09-09 11:53:18 · 1746 阅读 · 0 评论 -
[机器学习]04-逻辑回归(python)-03-API与癌症分类案例讲解
Logistic Regression) 的一API 介绍关于如何配置模型中的优化器、正则化和惩罚项。原创 2024-09-22 23:14:25 · 1333 阅读 · 0 评论 -
机器学习04-逻辑回归(python)-02原理与损失函数
线性回归输出数值,而逻辑回归输出概率。逻辑回归的输出值是 0 到 1 之间的概率,通常我们会设定一个阈值,比如 0.5,将大于 0.5 的归为 1 类,低于 0.5 的归为 0 类。逻辑回归的工作原理:逻辑回归通过线性模型输出一个值,并通过 Sigmoid 函数将其转换为 0 到 1 之间的概率值,表示样本属于某一类的概率。损失函数:使用对数似然损失函数衡量模型预测结果与真实结果的差距,模型通过最小化损失函数来优化自身参数。梯度下降:通过梯度下降算法更新模型的参数,使损失函数逐渐减小,找到最优的模型参数。原创 2024-09-21 21:30:58 · 1426 阅读 · 0 评论 -
机器学习05-聚类算法(python)
首先随机选择 3 名学生的成绩作为质心,然后算法根据每个学生的成绩将他们分配到最近的质心组,最后通过迭代更新每组的中心点,直到不再变化。这是因为网站通过聚类算法分析了成千上万的用户购买行为,找到了和你相似的用户,并推荐给你他们喜欢的商品。没有事先给出类别标签,算法会通过计算样本之间的相似度,把相似的样本自动归到一个组里,不同的算法和距离衡量方法会产生不同的分组结果。你可以看到四个不同的散点图,这些图显示了随着簇的数量变化,数据被如何分成不同的组。,把相似的东西放在一组里,而把不同的东西分到不同的组中。原创 2024-09-14 15:17:37 · 1892 阅读 · 0 评论 -
机器学习05-聚类算法(python)SC(轮廓系数)详解
凝聚度表示与簇 1 中其他点的平均距离。分离度表示) 与最近簇(簇 2)的平均距离。轮廓系数,表示样本聚类效果较好,值接近 1,说明它更好地属于它所在的簇。原创 2024-09-14 21:20:48 · 1770 阅读 · 0 评论 -
机器学习05-决策树(python)
决策树在生活中有广泛的应用,通过逐步判断条件并做出相应选择,可以简化复杂的决策过程。无论是日常穿衣、选择餐厅,还是购买物品,决策树都可以帮助你快速、逻辑清晰地做出决策。这种方式不仅适用于个人决策,也在商业和管理中得到了广泛应用,如客户分类、产品推荐等。信息熵(Entropy)是度量信息的不确定性的一种工具。在机器学习中,信息熵通常用于衡量一个系统或数据集的混乱程度或不确定性。生活中的信息熵与机器学习中的信息熵原理相同,都是用来描述系统中随机性或不确定性的大小。原创 2024-09-11 16:21:22 · 3426 阅读 · 2 评论 -
逻辑回归 和 支持向量机(SVM)比较
•。原创 2024-09-22 10:49:42 · 1523 阅读 · 0 评论