
数据挖掘
胡咯吧·
这个作者很懒,什么都没留下…
展开
-
Pandas--合并
合并读入数据集一、append与assignappend方法(a)利用序列添加行(必须指定name)(b)用DataFrame添加表assign方法该方法主要用于添加列,列名直接由参数指定:可以一次添加多个列:二、combine与updatecomine方法comine和update都是用于表的填充函数,可以根据某种规则填充(a)填充对象可以看出co...原创 2020-04-30 15:01:04 · 302 阅读 · 0 评论 -
数据挖掘中的建模与预测
数据挖掘中的建模与预测基础知识统计学习分类监督学习利用一组带标签的数据, 学习从输入到输出的映射, 然后将新数据用这种映射关系可以得到映射结果, 达到分类或者回归的目的。线性回归、决策树、SVD等非监督学习输入数据没有被标记,也没有确定的结果。K-means聚类、层次聚类等半监督学习在实际情况中,获取的数据大部分都是无标签的,人们企图加入一些人为标注的样本,使得无标签的数据通过...原创 2020-04-01 17:28:41 · 678 阅读 · 0 评论 -
特征工程(Feature Engineering)
特征工程(Feature Engineering)一、特征工程的相关知识点特征工程的定义 将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。特征工程包含以下几个部分数据理解;目的:探索数据,了解数据,主要在EDA阶段完成。定性数据:描述性质a) 定类: 按名称分类 —— 血型、城市b) 定序: 有序分类 —— 成绩定量数据:描述数量a) 定距: ...原创 2020-03-28 13:46:11 · 823 阅读 · 0 评论