
机器学习
一念起天涯咫尺
贪财好色,做个俗人.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
样本类别比例不均衡怎么解决?
1.过抽样:增加分类中少数类样本的数量来实现样本均衡,比较好的方法有SMOTE算法。 2.欠抽样:减少分类中多数样本的数量来实现平衡. 3.对分类样本中不同的类别赋予不同的权重. ...原创 2019-06-09 19:08:33 · 1175 阅读 · 0 评论 -
ID3,C4.5,CART的联系和区别
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 ID3和C4...原创 2019-06-03 21:32:12 · 2058 阅读 · 0 评论 -
KNN算法(K近邻算法)
KNN三要素: 1.K值得选取 1.1K值得选取值一般较小,通常使用交叉验证获取K值. 2.距离的度量 2.1距离的度量有以下几种: ① 欧氏距离 (https://img-blog.csdnimg.cn/20190627175652650.png) ②曼哈顿距离(https://img-blog.csdnimg.cn/20190627175729544.png) ③上确界距离(https://i...原创 2019-06-27 21:45:35 · 435 阅读 · 0 评论 -
K-means聚类
K-means聚类: 1.质心的选择(可以随机选择一个或者多个质心,一般选择两个) 2.计算各个数据到质心的最小距离,根据最小距离进行分类 3.依次迭代计算质心 4.当计算的质心与上次计算的质心一致时停止迭代,或者设置阈值,当距离小于阈值时停止迭代,或者设置迭代次数,满足迭代次数时停止迭代. Kmeans的优缺点: 优点:理解简单,容易实现,计算速度快,聚类效果明显 缺点: 1,K值选择不确定 2...原创 2019-06-28 20:45:23 · 242 阅读 · 0 评论