- 博客(182)
- 收藏
- 关注
原创 【Python入门速学】2.5. 浮点数及常见问题
在 Python 及大多数编程语言中,是用于表示小数的常见数据类型。然而,由于浮点数的底层实现基于二进制存储,可能会导致一些意想不到的行为,如舍入误差、不精确的比较等。本文将结合示例,探讨 Python 处理浮点数时可能遇到的问题,并提供应对策略。
2025-03-25 07:16:01
246
原创 【Python机器学习】4.1. 过拟合(overfitting)与欠拟合(underfitting)
左图能够大致表现出温度变化的趋势,但是与散点数据的偏差很大,就是欠拟合中间的图能够很好的表现出温度变化的过程,并且与散点数据的偏差不大,这是理想的拟合右图拟合出的曲线与散点数据的偏差值最小,但是起伏、斜率和波动很多,这在正常的气候变化中是不可能发生的,这条曲线也因此失去了通用性,这就是过拟合。
2025-03-25 07:14:06
846
原创 【Python机器学习】3.7. 主成分分析(PCA)实战
本文进行了主成分分析代码实战,紧承 3.4. 主成分分析(PCA)理论, 没看过的建议先看。
2025-03-23 12:11:53
534
原创 【Python入门速学】2.3. 比较运算符
=:检查是否相等!:检查是否不等:大于:小于>=:大于等于<=:小于等于= 是赋值,== 是比较(常见错误)字符串可以用 == 比较,也可以用 < > 进行字典顺序比较if-elif-else 结构用于多个条件判断。
2025-03-22 15:36:04
253
原创 【Python机器学习】3.6. 异常检测实战
本文对异常检测进行了实战代码演练,紧承 3.3. 异常检测(Anomaly Detection)理论,没看过的建议先看理论分析。
2025-03-22 15:31:03
686
原创 【Python入门速学】2.2. 条件控制语句(if语句)
if语句让程序可以根据不同情况执行不同的代码。if-else语句允许在条件为 False 时执行不同的代码。语句适用于多个条件的情况。缩进在 Python 中至关重要,所有 if 语句的代码块必须正确缩进。if语句的条件可以使用比较运算符==!>=<=逻辑运算符andornot。
2025-03-21 12:42:59
544
原创 【Python机器学习】3.5. 决策树实战:基于Iris数据集
本文紧承 3.1. 决策树理论(基础) 和 3.2. 决策树理论(进阶),没看过的建议先看理论分析。
2025-03-21 12:40:03
868
原创 【Python入门速学】2.1. 控制流
变量类型说明示例int整数x = 10float浮点数(小数)y = 3.14str字符串bool布尔值(True / False)布尔值(Boolean)是True 或 False,用于表示是/否的概念。布尔值是 Python 的第四种变量类型 bool。布尔值不能加引号,并且首字母必须大写。可以使用 str() 转换布尔值,使其与字符串拼接。
2025-03-20 05:48:54
411
原创 【Python机器学习】3.4. 主成分分析(Principle Component Analysis)理论
PCA是指在某些限定条件下,降低随机变量个数,得到一组“不相关”的主变量的过程。减少模型分析的数据量,提升处理效率,降低计算难度实现数据的可视化。
2025-03-20 05:47:10
757
原创 【Python入门速学】1.8. 注释(Comments)
Python 提供两种注释方式单行注释(#):适用于简短说明。多行注释(‘’’ 或 “”"):适用于程序描述或较长的解释。注释的作用让代码更容易被团队成员理解。方便自己回顾和维护代码。让未来的开发者更容易继承代码。编写优质注释的原则清晰简洁,不要冗余解释“为什么”,而不是“如何”避免过多或无意义的注释保持注释同步更新。
2025-03-19 06:32:45
250
原创 【Python机器学习】3.3. 异常检测(Anomaly Detection)理论:概率密度、正态分布
异常检测就是根据输入数据,对不符合预期模式的数据进行识别。
2025-03-19 06:30:33
1109
原创 【Python入门速学】1.7. 字符串(String)的操作
字符串拼接(Concatenation)只能用于两个字符串,不能直接与整数相加。示例字符串重复(Multiplication)可用于字符串和整数,使字符串重复指定次数。示例"Ha" * 3→ “HaHaHa”整数不能直接拼接字符串错误示例(会报错)正确做法(先用str()转换整数)
2025-03-18 11:44:17
244
原创 【Python机器学习】3.2. 决策树理论(进阶):ID3算法、信息熵原理、信息增益
本文主要介绍了ID3算法及所需的信息熵原理、信息增益原理
2025-03-18 11:43:12
1204
原创 【Python入门速学】1.6. 数学运算符
Python 提供了多种数学运算符,如 +、-、*、/、%、**。指数运算**)计算幂,如 3 ** 2 = 9。取余运算)返回除法的余数,如 17 % 3 = 2。负号运算符)可以取负值,如 -3。运算符优先级遵循PEMDAS规则,括号 () 可以改变计算顺序。
2025-03-17 09:00:48
248
原创 【Python机器学习】3.1. 决策树理论(基础)
决策树则是进行很多是否(if-else)的判断。决策树是一种对实例进行分类的树形结构,通过多层判断区分目标所属类别。其本质是通过多层判断,从训练数据集中归纳出一组分类规则。计算量小,运算速度快易于理解,可以清晰地查看各属性的重要性没有考虑到属性间的相关性样本类别分布不均时,容易影响模型表现。
2025-03-17 08:58:55
1025
原创 【Python入门速学】1.5. 用户输入与处理
input()获取用户输入,返回字符串。int()将字符串转换为整数,以便进行数学运算。函数组合(Function Composition)是编程中的重要概念,执行顺序为从内到外。处理用户输入时,应考虑类型转换和错误处理。
2025-03-16 07:39:17
386
原创 【Python机器学习】2.5. 使用KNN与MeanShift分别实现聚类分析实战
同KMeans一样,KNN划分的0、1、2类与`label`的0、1、2类不一样。KNN模型本身不知道`label`,所以它的划分是随意的,虽然也会分为3类,但KNN划分的0、1、2类不一定和`label`的0、1、2类一一对应
2025-03-16 07:38:06
825
原创 【Python机器学习】2.4. K均值聚类(KMeans Analysis)实战(进阶)
本文紧承上文 2.3. K均值聚类(KMeans Analysis)实战(基础) ,如果没有看请先看上一篇文章。
2025-03-15 13:32:34
550
原创 【Python机器学习】2.3. K均值聚类(KMeans Analysis)实战(基础)
之前我们进行了KMeans的理论分析,现在我们来进行实战
2025-03-14 06:02:44
584
原创 【Python入门速学】1.2. 使用Pyhton编程
在上一篇文章中,我们熟悉了 Python 的命令行,并创建了我们的第一个程序,打印出 `"Hello World"`。在本节课中,我们将深入了解 Python 语言的编程概念。
2025-03-13 06:46:37
477
原创 【Python机器学习】2.2. 聚类分析算法理论:K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift)
K均值算法是以空间中K个点为中心进行聚类,对最靠近他们的对象归类,是聚类算法中最为基础但也最为重要的算法
2025-03-13 06:43:50
1355
原创 【Python入门速学】1.1. Python简介:安装Python、运行Python、使用Python打印“Hello, World!”、Python的运算符和比较符
当你听到“Python”这个词时,你会想到什么?大多数人会认为这个语言是以蛇命名的,但事实并非如此。
2025-03-12 08:31:46
844
原创 【Python机器学习】2.1. 无监督学习(Unsupervised Learning):聚类分析、KMeans聚类、均值漂移聚类(MeanShift)、DBScan算法(基于密度的空间聚类算法)
无监督学习是一种机器学习方法,它在没有标签或监督信息的情况下,从数据中发现隐藏的模式或结构,自动进行分类或分群。
2025-03-12 08:28:56
1159
原创 【Python机器学习】1.10. 逻辑回归实战(高阶):超多阶(大于2)的逻辑回归
这篇文章我们会在 1.9. 逻辑回归实战(进阶) 的基础上再进一步,讲一下如何找(类)圆形的决策边界。圆形的回归边界大部分时候都会是二阶的,但有的时候数据很复杂,就会需要更多阶,本文涉及的就是这部分。
2025-03-10 06:52:57
926
原创 【Python机器学习】1.9. 逻辑回归实战(进阶):建立二阶边界模型
如果还要提升准确率就需要建立二阶的决策边界(一条曲线)。这里可视化决策边界稍微有点复杂,因为二阶的项变多了,但是思路是暴力且简单的。
2025-03-09 08:21:04
966
原创 【Python机器学习】1.8. 逻辑回归实战(基础):建立一阶边界模型、画分类散点图、逻辑回归模型的代码实现、可视化决策边界
对于比较少的数据,我们可以直接画图来看模型效果。对于比较多的数据,我们要定量地评估就不能只靠图了。
2025-03-08 14:38:58
1106
原创 【Python机器学习】1.7. 逻辑回归理论(进阶):多维度(因子)逻辑回归问题、决策边界、交叉熵损失函数、最小化损失函数
虽然这个图看上去仍然是一个二维图像,但是它的两个轴都是输入变量。实际的输出是图中的三角形和圆形。
2025-03-07 07:23:03
1364
原创 【Python机器学习】1.6. 逻辑回归理论(基础):逻辑函数、逻辑回归的原理、分类任务基本框架、通过线性回归求解分类问题
之所以叫做逻辑回归是因为第一步的这个函数叫做Sigmoid函数(逻辑函数),它将输入x映射到 `(0,1)`之间。
2025-03-06 12:38:01
830
原创 【Python机器学习】1.4. 评估线性回归模型模型表现:均方误差(MSE)、R方值、可视化
这里为了让大家对上一篇文章所创建的线性回归模型有一个基本的了解,先讲一些适用于线性回归模型评估的方法。
2025-03-04 08:35:42
894
原创 【Python机器学习】1.3. 线性回归实战(基础):单因子线性回归模型
Scikit-learn是Python语言中专门针对机器学习应用而发展出的开源框架(算法库)。同个这个算法库我们可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。
2025-03-03 16:46:41
934
原创 【Python机器学习】1.2. 线性回归理论:一元线性回归、最小化平方误差和公式(SSE)、梯度下降法
回归分析的定义:根据数据,确定两种或两种以上变量间相互依赖的定量关系。
2025-03-02 10:30:44
1618
原创 【Python机器学习】1.1. 机器学习(Machine Learning)介绍
机器学习是一种使计算机能够从数据中自动学习模式并进行预测或决策的算法和技术。
2025-03-01 07:24:01
1013
原创 【Python机器学习】0.2. 下载、安装和试运行需要的包:matplotlib、numpy和pandas
下载、安装和试运行需要的包:matplotlib、numpy和pandas
2025-02-28 08:37:33
944
原创 【Python机器学习】0.1. 环境配置(2025最新版):下载Python解释器和Anaconda、安装和打开Jupyter Notebook以及PyCharm + Anaconda的部署
这篇文章我们会手把手地教你下载Python解释器和Anaconda、安装和打开Jupyter Notebook以及PyCharm + Anaconda的部署。
2025-02-27 15:40:42
1121
原创 【Rust中级教程】题外话:Rust + Python联合编程(基于Maturin)
Rust性能好,但是代码难写。Python代码好写,但是性能不好。那为什么不把两者结合起来呢?让Python在顶层调用,用Rust写性能敏感的模块。
2025-02-26 06:57:50
1390
空空如也
Rust发布crate失败
2025-03-24
Opencv配置出错
2024-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人