文章目录
1.SVM的loss是啥?
SVM的损失函数是合页损失,合页损失函数不仅仅惩罚错误的预测,还惩罚不自信的成功预测。因此,我们在不过度关注准确性的实时决策时使用它。
第一项是损失函数,第二项是正则化,防止过拟合。在损失函数零区域内的都是非支持向量,并不参与最终超平面的决定,这是支持向量最大的优势。对训练样本的依赖大大减少,训练效率高。
除此之外,损失函数还可以是指数损失y=exp(-x)和对率损失y=log(1+exp(-x))
2.kmeans聚类如何选择初始点?
kmeans是一种无监督算法。聚类需要确定两个点
- 如何选择聚类的类别数目
- 如何选择初始聚类的位置
(1)确定聚类数目的方法是“手肘法”,即将所有可能聚类的类别数目都列举出来,寻找它们对应的损失函数。在损失函数产生拐点的地方就是我们需要确定的类别。如有100个样本,则可能的类别是2~100类,计算每个可能类别数目下的损失函数
(2)确定初始点的位置: - 随机选择n个类的初始点;
- 计算其他样本到这n个初始点的距离,将所有样本分成n类;
- 在n类的每一个类内作平均,确定新的聚类中心;