
Python机器学习
文章平均质量分 93
SomeB1oody
会努力更新的,保证每天必更一到两篇,不更更多是因为流量券一天最多就2篇
展开
-
【Python机器学习】4.1. 过拟合(overfitting)与欠拟合(underfitting)
左图能够大致表现出温度变化的趋势,但是与散点数据的偏差很大,就是欠拟合中间的图能够很好的表现出温度变化的过程,并且与散点数据的偏差不大,这是理想的拟合右图拟合出的曲线与散点数据的偏差值最小,但是起伏、斜率和波动很多,这在正常的气候变化中是不可能发生的,这条曲线也因此失去了通用性,这就是过拟合。原创 2025-03-25 07:14:06 · 847 阅读 · 0 评论 -
【Python机器学习】3.7. 主成分分析(PCA)实战
本文进行了主成分分析代码实战,紧承 3.4. 主成分分析(PCA)理论, 没看过的建议先看。原创 2025-03-23 12:11:53 · 534 阅读 · 0 评论 -
【Python机器学习】3.6. 异常检测实战
本文对异常检测进行了实战代码演练,紧承 3.3. 异常检测(Anomaly Detection)理论,没看过的建议先看理论分析。原创 2025-03-22 15:31:03 · 686 阅读 · 0 评论 -
【Python机器学习】3.5. 决策树实战:基于Iris数据集
本文紧承 3.1. 决策树理论(基础) 和 3.2. 决策树理论(进阶),没看过的建议先看理论分析。原创 2025-03-21 12:40:03 · 868 阅读 · 0 评论 -
【Python机器学习】3.4. 主成分分析(Principle Component Analysis)理论
PCA是指在某些限定条件下,降低随机变量个数,得到一组“不相关”的主变量的过程。减少模型分析的数据量,提升处理效率,降低计算难度实现数据的可视化。原创 2025-03-20 05:47:10 · 758 阅读 · 0 评论 -
【Python机器学习】3.3. 异常检测(Anomaly Detection)理论:概率密度、正态分布
异常检测就是根据输入数据,对不符合预期模式的数据进行识别。原创 2025-03-19 06:30:33 · 1109 阅读 · 0 评论 -
【Python机器学习】3.2. 决策树理论(进阶):ID3算法、信息熵原理、信息增益
本文主要介绍了ID3算法及所需的信息熵原理、信息增益原理原创 2025-03-18 11:43:12 · 1204 阅读 · 0 评论 -
【Python机器学习】3.1. 决策树理论(基础)
决策树则是进行很多是否(if-else)的判断。决策树是一种对实例进行分类的树形结构,通过多层判断区分目标所属类别。其本质是通过多层判断,从训练数据集中归纳出一组分类规则。计算量小,运算速度快易于理解,可以清晰地查看各属性的重要性没有考虑到属性间的相关性样本类别分布不均时,容易影响模型表现。原创 2025-03-17 08:58:55 · 1025 阅读 · 0 评论 -
【Python机器学习】2.5. 使用KNN与MeanShift分别实现聚类分析实战
同KMeans一样,KNN划分的0、1、2类与`label`的0、1、2类不一样。KNN模型本身不知道`label`,所以它的划分是随意的,虽然也会分为3类,但KNN划分的0、1、2类不一定和`label`的0、1、2类一一对应原创 2025-03-16 07:38:06 · 825 阅读 · 0 评论 -
【Python机器学习】2.4. K均值聚类(KMeans Analysis)实战(进阶)
本文紧承上文 2.3. K均值聚类(KMeans Analysis)实战(基础) ,如果没有看请先看上一篇文章。原创 2025-03-15 13:32:34 · 550 阅读 · 0 评论 -
【Python机器学习】2.3. K均值聚类(KMeans Analysis)实战(基础)
之前我们进行了KMeans的理论分析,现在我们来进行实战原创 2025-03-14 06:02:44 · 584 阅读 · 0 评论 -
【Python机器学习】2.2. 聚类分析算法理论:K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift)
K均值算法是以空间中K个点为中心进行聚类,对最靠近他们的对象归类,是聚类算法中最为基础但也最为重要的算法原创 2025-03-13 06:43:50 · 1356 阅读 · 0 评论 -
【Python机器学习】2.1. 无监督学习(Unsupervised Learning):聚类分析、KMeans聚类、均值漂移聚类(MeanShift)、DBScan算法(基于密度的空间聚类算法)
无监督学习是一种机器学习方法,它在没有标签或监督信息的情况下,从数据中发现隐藏的模式或结构,自动进行分类或分群。原创 2025-03-12 08:28:56 · 1159 阅读 · 0 评论 -
【Python机器学习】1.10. 逻辑回归实战(高阶):超多阶(大于2)的逻辑回归
这篇文章我们会在 1.9. 逻辑回归实战(进阶) 的基础上再进一步,讲一下如何找(类)圆形的决策边界。圆形的回归边界大部分时候都会是二阶的,但有的时候数据很复杂,就会需要更多阶,本文涉及的就是这部分。原创 2025-03-10 06:52:57 · 926 阅读 · 0 评论 -
【Python机器学习】1.9. 逻辑回归实战(进阶):建立二阶边界模型
如果还要提升准确率就需要建立二阶的决策边界(一条曲线)。这里可视化决策边界稍微有点复杂,因为二阶的项变多了,但是思路是暴力且简单的。原创 2025-03-09 08:21:04 · 966 阅读 · 0 评论 -
【Python机器学习】1.8. 逻辑回归实战(基础):建立一阶边界模型、画分类散点图、逻辑回归模型的代码实现、可视化决策边界
对于比较少的数据,我们可以直接画图来看模型效果。对于比较多的数据,我们要定量地评估就不能只靠图了。原创 2025-03-08 14:38:58 · 1106 阅读 · 0 评论 -
【Python机器学习】1.7. 逻辑回归理论(进阶):多维度(因子)逻辑回归问题、决策边界、交叉熵损失函数、最小化损失函数
虽然这个图看上去仍然是一个二维图像,但是它的两个轴都是输入变量。实际的输出是图中的三角形和圆形。原创 2025-03-07 07:23:03 · 1364 阅读 · 0 评论 -
【Python机器学习】1.6. 逻辑回归理论(基础):逻辑函数、逻辑回归的原理、分类任务基本框架、通过线性回归求解分类问题
之所以叫做逻辑回归是因为第一步的这个函数叫做Sigmoid函数(逻辑函数),它将输入x映射到 `(0,1)`之间。原创 2025-03-06 12:38:01 · 831 阅读 · 0 评论 -
【Python机器学习】1.5. 线性回归实战(进阶):多因子线性回归模型
在进阶篇中我们会使用特别复杂且巨大的数据。原创 2025-03-05 10:01:10 · 929 阅读 · 0 评论 -
【Python机器学习】1.4. 评估线性回归模型模型表现:均方误差(MSE)、R方值、可视化
这里为了让大家对上一篇文章所创建的线性回归模型有一个基本的了解,先讲一些适用于线性回归模型评估的方法。原创 2025-03-04 08:35:42 · 895 阅读 · 0 评论 -
【Python机器学习】1.3. 线性回归实战(基础):单因子线性回归模型
Scikit-learn是Python语言中专门针对机器学习应用而发展出的开源框架(算法库)。同个这个算法库我们可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。原创 2025-03-03 16:46:41 · 934 阅读 · 0 评论 -
【Python机器学习】1.2. 线性回归理论:一元线性回归、最小化平方误差和公式(SSE)、梯度下降法
回归分析的定义:根据数据,确定两种或两种以上变量间相互依赖的定量关系。原创 2025-03-02 10:30:44 · 1618 阅读 · 0 评论 -
【Python机器学习】1.1. 机器学习(Machine Learning)介绍
机器学习是一种使计算机能够从数据中自动学习模式并进行预测或决策的算法和技术。原创 2025-03-01 07:24:01 · 1014 阅读 · 0 评论 -
【Python机器学习】0.2. 下载、安装和试运行需要的包:matplotlib、numpy和pandas
下载、安装和试运行需要的包:matplotlib、numpy和pandas原创 2025-02-28 08:37:33 · 946 阅读 · 0 评论 -
【Python机器学习】0.1. 环境配置(2025最新版):下载Python解释器和Anaconda、安装和打开Jupyter Notebook以及PyCharm + Anaconda的部署
这篇文章我们会手把手地教你下载Python解释器和Anaconda、安装和打开Jupyter Notebook以及PyCharm + Anaconda的部署。原创 2025-02-27 15:40:42 · 1121 阅读 · 0 评论