
机器学习
JabinY
这个作者很懒,什么都没留下…
展开
-
sklearn学习_第三章_数据预处理和特征工程
数据预处理和特征工程概述数据预处理与特征工程数据挖掘的五大流程:获取数据数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小数据预处理的目的:让数据适应模型,匹配模型的需求特征工程:特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征的过程,可以通过挑选原创 2020-08-26 14:08:16 · 573 阅读 · 0 评论 -
sklearn学习_第二章_随机森林
随机森林概述集成算法概述集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现。sklearn中的集成算法sklearn中的集成算法模块ensemble类 类的功能ensemble.AdaBoostClassifier AdaBoost分类ensemble.AdaB原创 2020-08-25 10:51:57 · 575 阅读 · 0 评论 -
sklearn学习_第一章_决策树
决策树1 工作原理决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。最初的问题所在的地方叫做根节点,在得到结论前的每一个问题都是中间节点,而得到的每一个结论(动物的类别)都叫做叶子节点。备注:树干就是根节点只能向外延展,树枝是中间节点,树枝上还能长树枝所以既能从根节点接收数据也能向他延展出去的树枝输出数据。叶子是叶子节点,叶子上不能长叶子了,所以只有进没有出。决策树算法的核心是要原创 2020-08-24 15:28:55 · 500 阅读 · 0 评论