
数据挖掘
_Shawn_Shawn_
If you shed tears when you miss the sun, you also miss the stars.
展开
-
数据挖掘导论 - 第二章:数据 - 笔记
文章目录数据类型描述数据属性属性类型定义属性层次的变换非对称的属性数据质量鲁棒算法数据预处理数据类型描述数据属性相异性 = !=序 < <= > >=加法 + -乘法 * /属性类型标称:分类的 = !=不同的名字,用以区分对象【例】邮编、性别、ID、眼球颜色序数:分类的 < >用以确定对象的序【例】成绩、...原创 2019-09-13 11:43:50 · 1352 阅读 · 0 评论 -
数据挖掘导论 - 第四章:决策树 - 笔记
文章目录预备知识分类与回归分类模型的目的解决分类问题的一般方法预备知识分类与回归通过学习得到一个目标函数(分类模型) f,把每个属性集x映射到一个预先定义的类标号y回归是一种预测建模任务,其中目标属性y是连续的分类模型的目的描述性建模分类模型可以作为解释性的工具,用于区分不同类中的对象。预测性建模用于预测位置记录的类标号分类计数适合预测或描述二元或标称类型的数据集,对于叙述分...原创 2019-09-17 13:15:21 · 3348 阅读 · 0 评论 -
数据挖掘导论 - 第四章:决策树 - 习题
未完待续原创 2019-09-17 20:11:13 · 2706 阅读 · 2 评论 -
数据挖掘-经典算法-决策树ID3算法实现
from math import logimport operatordef calcShannonent(dataSet): #计算数据的熵(entropy) numEntries = len(dataSet) #数据条数 labelCounts = {} for featV...转载 2019-09-23 19:55:17 · 1228 阅读 · 0 评论