- 博客(5)
- 收藏
- 关注
原创 建立二叉决策树伪代码
1.对输入的训练集,如果集合为空,算法结束2.如果不能选择到一个合适的特征及其决策值,则建立叶子节点,算法结束3.根据选择到的特征及其决策值,建立内部节点4.依据选择到的特征及其决策值将输入的训练集划分为左、右两个子集,对每个子集递归调用本算法。第2步中,选择哪一个特征及其决策值来划分训练集对生成的树结构影响很大,对决策树的研究基本上集中于该问题。第3步:建立内部测试节点第4步:根据选定特征及其决策值将训练集划分为若干个子集,对每个子集执行递归算法,子集建立的节点是本级节点的子节.
2022-05-06 16:38:42
444
原创 回归:最小二乘法求解回归模型代码
import numpy as npimport matplotlib.pyplot as pltdef least_square(X,Y): ''' 最小二乘法 :param X:矩阵,样本特征矩阵 :param Y: 矩阵,标签向量 :return: 矩阵,回归系数 ''' W = (X * X.T).I * X * Y.T#教材公式 return Wtemperatures = [15,20,25,30,35,40]flow.
2022-05-05 16:29:49
1692
原创 DBSCAN聚类算法原理和伪代码
1.DBSCAN算法K-means聚类算法基于距离的聚类算法,其中的局限性在于,在凸集中进行聚类,但是在非凸集聚类效果不佳。如图:对于下图,进行聚类,传统的聚类算法效果不佳,使用DBSCAN则效果更佳。DBSCAN是基于密度的聚类算法,将样本点分为三类:核心点:样本点处的密度大于密度下限边界点:样本点处的密度小于密度下限,但样本点在某一核心点的邻域内噪声点:既不是核心点也不是样本点原理:DBSCAN聚类算法本质上就是通过寻找一系列的紧紧挨着的高密度核心点(core p
2022-05-04 13:53:55
5503
转载 时间序列异常检测综述
1.介绍时间序列异常检测可以运用的地方:工业设备异常检测、欺诈检测,日志监控目录1.介绍异常:一种与其他观测结果偏离甚大的观测结果,从而引起怀疑,属于其他的模式。通常可以将异常的含义分为两类:一类是不管不顾全部收集的数据:如调查本市的居民平均工资,应该将数据进行清洗,筛选掉首富的数据,让数据更能符合普通居民数据的分布。另一类是有用的数据:获取一类数据,如机器运转,大部分是正常状态的数据,当遇到异常数据就可以提高注意。在时间序列背景下的离群值检测技术的分类离群值..
2022-03-21 11:05:52
2954
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人