
数据科学
DrCrypto
这个作者很懒,什么都没留下…
展开
-
【数据科学】什么是数据科学?
数据是现实世界运转留下的痕迹。 这些痕迹如何展示出来,则取决于我们采用什么样的数据收集和样本采集方法。 将具象的数据转化为抽象的数据,过程是绝对主观的。 数据的随机性和不确定性来源: 过程本身 数据采集方法 统计推断 关注的是如何从随机过程产生的数据中提取信息。 关于建模 数据即信息,不需要模型,了解相关性就够了。–Anderson 这是错误的想法。 什么是模型 模型是一个特殊的镜片,...原创 2018-11-22 16:42:22 · 598 阅读 · 0 评论 -
【数据科学】探索性数据分析
通常表现为:画一些直方图等,来看看数据的分布。 看起来探索性数据分析只是很小的一部分,其实它的地位很重要,是数据可科学中的重要一环。 这个像太祖长拳,用在不同的人手里,会有不同的效果。换句话说,随着你的认知的提升,探索性数据分析能够得出的东西是完全不同的。 基本工具 图,表以及汇总统计量。 探索性数据分析是什么 是一种系统性分析数据的方法: 用盒形图展示所有变量的分布情况 用散点图展示变量两两之...原创 2018-11-22 16:57:42 · 601 阅读 · 0 评论 -
【数据科学】kNN算法笔记
kNN的主要思想:根据某个对象的属性值找到相似的对象们,让对象们一起投票决定这个对象属于哪一类。 这里银行的信息是,根据属性值找到的对象们,并不是来源于一个类,如果是一个类的话,直接将这个待分类对象归类为此类就完成了。 既然是投票,就意味着可能是平票,如果平了的话,就随便选择一个类作为此类的分类即可。 《数据科学实战》这本书里举的例子很贴近我们的生活,引用过来,作为参考: 假设一个人会对自己看过...原创 2018-11-27 11:07:01 · 494 阅读 · 0 评论 -
【数据科学】什么是数据分析
数据分析是将原始数据进行排序和组织的过程,是用来帮助解释过去和预测未来的一系列方法。 数据分析不是只针对数字进行分析,而是关于: 如何设定/提出问题 演化解释 验证假设 数据的本质 现实世界所有场景都包含数据,数据分为: 结构化/非结构化 连续/离散 … 有不同的分类方法,从更普遍的意义上来看,数据分为: 分类型 数值型 其中,分类型中又分为: 定类:如住房类型 定序:如年龄 ...原创 2018-12-25 18:32:14 · 428 阅读 · 0 评论