7、机器学习与编程工具全解析

机器学习与编程工具全解析

1. 决策树实现

决策树的创建从根节点开始。第一步是选择一个数据属性,并基于此属性设置一个逻辑测试。当得到一组结果后,可以进行分支并创建另一组测试,用于创建子节点。一旦至少有一个子节点,就可以对其应用递归拆分过程,以确保得到纯净的决策树叶节点。需要注意的是,纯度水平是根据从单个类别中衍生出的案例数量来确定的。此时,可以开始修剪决策树,去除任何不能提高分类阶段准确性的部分。此外,还需要评估基于每个属性执行的每一次拆分,以确定最优属性和拆分方式。

下面以鸢尾花数据集为例,借助Scikit - learn库进行决策树的实现,不过书中未给出此部分具体代码,大家可以参考Scikit - learn官方文档进行操作,基本流程如下:
1. 加载鸢尾花数据集。
2. 选择合适的属性进行逻辑测试。
3. 递归拆分节点。
4. 修剪决策树。

2. K - 均值聚类

无监督学习方法非常适合处理无标签数据,其中K - 均值聚类是一种流行的无监督学习算法和聚类技术。其核心思想是根据数据值的相似性构建数据簇。具体步骤如下:
1. 确定K值,即定义的簇的总数。
2. 将簇构建为K个点,每个点持有代表整个簇的平均值。
3. 根据最接近的平均值为数据值分配簇。
4. 经过多次迭代,核心值会移动到使性能指标较低的位置,此时得到聚类结果。

2.1 代码实现

以下是使用UCI手写数字数据集进行K - 均值聚类的代码:

from time import time
imp
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值