Python AI教程之二十：监督学习之集成分类器

潜洋

已于 2025-01-14 07:29:01 修改

阅读量329

点赞数 4

分类专栏： Python中级人工智能文章标签： python 人工智能开发语言

于 2025-01-14 07:28:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/xt14327/article/details/145123808

版权

Python中级同时被 2 个专栏收录

62 篇文章

订阅专栏

23 篇文章

订阅专栏

集成分类器 | 数据挖掘

集成学习通过组合多个模型来帮助提高机器学习结果。与单个模型相比，这种方法可以产生更好的预测性能。基本思想是学习一组分类器（专家）并允许它们投票。

优点：提高预测准确率。
缺点：很难理解分类器集合。

为什么集成能发挥作用？

Dietterich（2002）表明，集成可以克服三个问题——

统计问题——
当假设空间对于可用数据量来说太大时，就会出现统计问题。因此，有许多假设对数据的准确性相同，而学习算法只会选择其中之一！所选假设在未见数据上的准确性可能会很低！
计算问题——
当学习算法无法保证找到最佳假设时，就会出现计算问题。
表征问题——
当假设空间不包含目标类别的任何良好近似时，就会出现表征问题。

开发集成模型的主要挑战是什么？

主要的挑战不是获得高精度的基础模型，而是获得犯不同错误类型的基础模型。例如，如果使用集成进行分类，即使基础分类器准确率较低，如果不同的基础模型对不同的训练示例进行错误分类，也可以实现高精度。

独立构建集成的方法 –

多数票
套袋和随机森林
随机性注入
特征选择集成
纠错输出编码

协调构建集成的方法 –

提升
堆叠

可靠分类：元分类器方法
联合训练和自训练

集成分类器的类型

Bagging：

Bagging（Bootstrap Aggregation）用于降低决策树的方差。假设一个由 d 个元组组成的集合 D，在每次迭代i时，都会从 D 中抽取一个由 d 个元组组成的训练集 D i （即 bootstrap）。然后针对每个训练集 D < i 学习一个分类器模型 M i 。每个分类器 M i返回其类别预测。Bagged 分类器 M* 计算投票数并将投票数最多的类别分配给 X（未知样本）。

Bagging的实施步骤

随机森林：

随机森林是 bagging 的扩展。集合中的每个分类器都是决策树分类器，使用每个节点的随机属性选择来生成，以确定分割。在分类过程中，每棵树都会投票并返回最受欢迎的类别。

随机森林的实施步骤-

从具有相等元组的原始数据集创建多个子集，并选择可替换的观测值。
在每个子集上创建一个基础模型。
每个模型从各个训练集中并行学习，且彼此独立。
最终的预测是通过结合所有模型的预测来确定的。

博客等级

码龄19年

140
原创

3369
点赞

2199
收藏

1703
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Python AI教程之十九：监督学习之决策树（10）超参调整

下一篇：: Sprint Boot教程之五十九：使用 Spring Boot 在 Apache Kafka 中进行消息压缩

最新评论

Python AI教程之十一：监督学习之决策树（2）使用 sklearn 进行决策树回归
潜洋: ''' 第二题排序+双指针：排序：将列表中的元素从小到大排序。双指针：设置两个指针，初始时分别指向列表的首尾。移动指针：如果两个指针指向的元素之和小于m，则将左指针右移。如果两个指针指向的元素之大于m，则将右指针左移。在移动过程中，不断更新最接近m的和以及对应的下标。时间复杂度为O(nlogn)，效率更高。 ''' def find_closest_sum(nums, target): """ 找到列表中两个元素的和最接近目标值的元素下标 Args: nums: 一个列表，包含n个整数 target: 目标值 Returns: 一个列表，包含两个元素的下标，表示最接近目标值的元素对 """ nums.sort() # 对列表进行排序 n = len(nums) left, right = 0, n - 1 closest_sum = float('inf') result = [-1, -1] while left < right: curr_sum = nums[left] + nums[right] if abs(curr_sum - target) < closest_sum: closest_sum = abs(curr_sum - target) result = [left, right] if curr_sum < target: left += 1 else: right -= 1 return result # 示例用法 nums = [10, 13 , 22, 28, 29, 30, 40, 42, 48] target = 54 result = find_closest_sum(nums, target) print(result)
Python AI教程之十一：监督学习之决策树（2）使用 sklearn 进行决策树回归
潜洋: #第一题思路：每次用最少的步数逼近 x//2; 这里用到了递归; x的初始值是b def step(a,b,ret): if b<2*a: for i in range(0,b-a): ret.append('+') return True x = b // 2 r = b % 2 step(a,x,ret) ret.append('*') if r>0: ret.append('+') def min_step(a,b): if b<a: return -1 ret=[] step(a,b,ret) return ret a=10 b=26 ret = min_step(a,b) print(ret)
Python AI教程之十一：监督学习之决策树（2）使用 sklearn 进行决策树回归
2401_87435637: 求助大佬Python题目: 1.给定两个整数 a ≤ b, 编写一个程序,通过加1和乘以2的方式，用最少的步骤将a变换成b.用Python 编程。 10和36 应该先加三个1再乘2，如果先乘2再加1次数就多了。一直搞不明白 2.给一个n个元素的列表再给一个阀值m 使得其中两个元素的和最接近m 返回两个数字的下标希望大佬百忙之中帮忙解答，万分感谢
Spring Boot教程之十七：使用 ModelMapper 将实体映射到 DTO
LIKEYYLL: 每一个步骤都很清晰，程序也很简明
Spring Boot 教程之六：Spring Boot - 架构
全栈小5: 优质好文，博主用心，写了这么实用有效的分享，期盼博主光顾我的博客，给予宝贵指导！互相进步！支持【Spring Boot 教程之六：Spring Boot - 架构，博主这篇文章，值得一看】

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

潜洋 你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。