
数据科学家的工具
elden_nie
这个作者很懒,什么都没留下…
展开
-
01-02 数据科学家如何获取帮助
1、问问题(1)上课问老师问题(2)在mooc上上传问题到信息版2、通常最快速获取到答案的途径是你自己找到答案(1)首先自己回答自己的问题这很重要(2)如果你的问题可以在帮助文档或者google hit上搜索到,那你应该首先读文档或者直接google.(3)如果你在论坛上看到了你解决过的问题,你应该上传你的答案。3、一些重要的帮助你的r语言的命令(1原创 2015-05-02 21:22:58 · 383 阅读 · 0 评论 -
01_01 工具概览
1、数据科学家干什么?(1)定义问题。(2)定义理想的数据集。(3)决定目标数据。(4)获取数据。(5)清洗数据。(6)数据分析。(7)分析预测/模型化。(8)解释结果。(9)验证结果。(10)综合陈述结果。(11)编写可重复使用的代码。(12)公布结果给众人。2、数据科学家的编程公具和编程环境主要是r语言以及对应的r-studio。3、分享你的成果利用gi原创 2015-05-02 21:08:16 · 313 阅读 · 0 评论 -
01 _04 R语言概览
1、R语言的内容 数据类型、子集、读取和存储数据、控制结构、函数、作用域、向量化操作、日期和时间、调试、模拟、优化2、从文本整行读取数据 readLines可以用来整行整行地读取网页的整页数据conx3、寻找错误如何知道你自己的函数出错了?(1)你的输入是什么?你如何调用你的函数?(2)你认为函数调用完后的是什么?输出、信息、或者其他答案原创 2015-05-03 16:56:02 · 396 阅读 · 0 评论 -
01_06 探索性数据分析概览
1、探索性数据分析内容(1)图形分析的规则(2)探索性图形(3)R中的绘图系统:base,lattice,ggplot2(4)系统聚类(5)K-means聚类(6)降维2、加一个geomqplot(displ,hwy,data=mpg,geom=c("point","smooth")) 3、图形分析的规则规则1:对比规则2:分析因果关系、原创 2015-05-03 17:22:46 · 505 阅读 · 0 评论 -
01_03 获取答案
1、数据科学关键特点之一数据科学是集数据分析、黑客技术、实际知识的交集。2、黑客的主要特点(1)愿意自己去找到答案(2)知道自己该去哪儿找到答案(3)不会被新的数据类型或者包吓到(4)不害怕说自己不知道(5)礼貌而冷酷3、不同问题的答案的对应地点(1)R语言论坛上搜索、读帮助文档、网上搜索、询问技术好的朋友、将问题提交到stack overf原创 2015-05-03 16:54:36 · 371 阅读 · 0 评论 -
01_05 数据获取和清理概览
1、数据获取和清理的内容(1)脏数据和干净数据(2)下载文档(3)读取数据(excel,xml,json,mysql,hdf5,web....)(4)合并数据(5)重新构造数据(6)汇总数据(7)寻找和替换(8)数据源2、数据库连接和列举ucsDb result result3、合并数据——merge()mergeData2原创 2015-05-03 17:11:34 · 378 阅读 · 0 评论