- 博客(4)
- 收藏
- 关注
原创 K-means聚类
K-means聚类:1.质心的选择(可以随机选择一个或者多个质心,一般选择两个)2.计算各个数据到质心的最小距离,根据最小距离进行分类3.依次迭代计算质心4.当计算的质心与上次计算的质心一致时停止迭代,或者设置阈值,当距离小于阈值时停止迭代,或者设置迭代次数,满足迭代次数时停止迭代.Kmeans的优缺点:优点:理解简单,容易实现,计算速度快,聚类效果明显缺点:1,K值选择不确定2...
2019-06-28 20:45:23
227
原创 KNN算法(K近邻算法)
KNN三要素:1.K值得选取1.1K值得选取值一般较小,通常使用交叉验证获取K值.2.距离的度量2.1距离的度量有以下几种:① 欧氏距离 (https://img-blog.csdnimg.cn/20190627175652650.png)②曼哈顿距离(https://img-blog.csdnimg.cn/20190627175729544.png)③上确界距离(https://i...
2019-06-27 21:45:35
418
原创 样本类别比例不均衡怎么解决?
1.过抽样:增加分类中少数类样本的数量来实现样本均衡,比较好的方法有SMOTE算法。2.欠抽样:减少分类中多数样本的数量来实现平衡.3.对分类样本中不同的类别赋予不同的权重....
2019-06-09 19:08:33
1163
原创 ID3,C4.5,CART的联系和区别
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入ID3和C4...
2019-06-03 21:32:12
2029
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人