传统机器学习与深度学习入门指南
传统机器学习算法
- 模型性能比较与选择
在机器学习中,最近邻模型和逻辑回归模型的性能相近。此时,你可以选择调整超参数,或者决定部署其中一个模型。有工具能让你轻松地对多种分类器进行原型设计,并评估每个分类器,以确定哪个最适合在生产环境中部署。 - 无监督学习 - 聚类
- 聚类概述 :无监督学习是一种仅从输入数据中学习,而无需访问任何目标信息的机器学习类型。聚类是最常见的无监督学习类型之一,它是在数据集中识别相似数据点的簇或组的过程。常见的聚类方法包括K-Means聚类、层次聚类、谱聚类等。
- K-Means聚类 :K-Means聚类是实践中最常见的聚类类型,它随机将K个质心分配到数据集中的随机点,并迭代更新每个质心,直到达到最优配置。例如,对于在线商店的购物者行为数据集,你可以使用K-Means聚类对购物者行为进行聚类,了解访问你商店的购物者的一般类型,如重度消费者和非确定性浏览者。
- 确定聚类数量 :聚类的一个核心挑战是确定合适的聚类数量。通常,你需要可视化数据集并进行某种高级分析来确定合适的聚类数量。因为现实世界的数据往往比较复杂,不一定能很好地聚类。
- K-Means聚类代码示例 :
# 训
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



