- 博客(27)
- 收藏
- 关注
原创 DBSCAN与分层聚类
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。基于密度这点有什么好处呢?,我们知道Kmeans聚类算法只能处理球形的簇,也就是一个聚成实心的团(这是因为算法本身计算平均距离的局限)。
2023-07-19 10:15:12
420
原创 简单SVM
C值较小,最终间隔会较大,但会有较多的样本点出现在间隔内。C值越大,分类器会减少误分类,但最终间隔会较小。有三个类别,这里只拿两个类别来展示二分类。
2023-07-18 21:10:14
60
1
原创 Kmeans简单实现
从上图中可以明显的看出,kmeans的缺点了。在每次的聚类产生的划分都是不一样的这表明它受随机初始化的初始簇中心影响较大,而且样本分布如左上图的这种,用简单的距离就很难把他们细分开了。
2023-07-18 20:39:07
887
1
原创 如何理解线性的SVM
一般情况下我们会认为,L2较L1和L3更好,为什么?假设,当有一个蓝色类别的测试数据,如果是L1的这种分法,那它就会把这个蓝色的点归回,紫色三角形那一类。对与L3同理会有这种情况。如图:那使我们的模型在无数条线中,分的完美,?L2直线有什么特点?换句话说就是b线之上的区域都是蓝色类别的地盘,a线下面的都是紫色类别的地盘。本着公平公正的原则,类似于拔河,双方队伍中离绳子中点最近的那两个人,到中点的距离要一样。(可能是不恰当的比方)这样才不会使得算法有偏向于某一对的嫌疑!
2023-07-17 18:54:34
66
1
原创 softmax回归实现手写数字识别
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KIAOq2DU-1689218911304)(output_6_2.png)]第一列是label,其余列是图片像素矩阵的平铺向量,共784个像素值。784个特征太多了,而且大多数都是0的稀疏矩阵,计算没什么意义。这里利用PCA多特征进行降维,减少特征的维度。
2023-07-13 11:30:23
504
1
原创 天池工业蒸汽量中不同梯度下降策略的效果
梯度下降法(Gradient Descent)是一个算法,但不是像多元线性回归那样是一个具体做回归任务的算法,而是一个非常通用的优化算法来帮助一些机器学习算法(都是无约束最优化问题)求解出最优解, 所谓的通用就是很多机器学习算法都是用梯度下降,甚至深度学习也是用它来求解最优解。所有优化算法的目的都是期望以最快的速度把模型参数θ求解出来,梯度下降法就是一种经典常用的优化算法。
2023-07-10 17:45:31
86
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人