最近复习算法准备校招,顺便写一写算作补上以前欠的债。
1.最小二乘法
有一堆数据点(Xi,Yi),其中i从0到n,那么我现在用一个超平面去拟合这些数据点,这个超平面的方程形式?whatever,在最小二乘里这不是重点,你可以是线性也可以是非线性,方程就记作y=f(x),其中有参数Bi,假设有k个。
好我们的环境已经配好了,然后是方法的应用。这个方法是一个参数估计方法,损失函数是误差的平方和,估计的方法是求偏导。结束了。
这个比较基础,就懒得写公式了。。
2.k-means
算法的步骤如下:
- 随机在特征空间里取K个种子点(初始点)。
- 然后对图中的所有点求到这K个种子点的距离,假如点Pi离种子点Si最近,那么Pi属于Si点群。
- 接下来,根据点群中所有点的坐标更新中心的坐标,更新公式后面介绍。

本文介绍了机器学习中的两种常见算法:最小二乘法和k-means聚类。最小二乘法是一种参数估计方法,通过最小化误差的平方和来寻找最佳拟合超平面。k-means聚类算法则涉及选择初始种子点,通过迭代更新聚类中心,直到中心不再移动。文章还探讨了k-means算法的两个主要缺点:聚类中心个数K的预设定以及初始聚类中心选择的影响,并提出了k-means++算法作为改进方案。
最低0.47元/天 解锁文章
10万+

被折叠的 条评论
为什么被折叠?



