约翰霍普金斯大学 data science toolbox 笔记

这门课程由生物学院老师讲授,聚焦R语言在数据分析领域的应用,涵盖从基础统计学到进阶分析技巧,包括使用搜索引擎、学习黑客技能、推荐书籍、R软件安装与管理等,为数据科学从业者提供全面的技能提升路径。

data scientists toolbox

这门课是由生物学院的老师讲授的,选择的是R语言
statistics is the science of learning from data
需要学会用google和stackoverflow, ie 学会一些hacking skill
列出了这些参考书Specialization Textbooks

Elements of Data Analytic Style by Jeff Leek
R Programming for Data Science by Roger Peng
Exploratory Data Analysis with R by Roger Peng
Report Writing for Data Science in R by Roger Peng
Statistical Inference for Data Science by Brian Caffo
Regression Modeling for Data Science in R by Brian Caffo
Developing Data Products in R by Brian Caffo
In addition, to the above books, two additional books that are highly relevant to the Specialization are

The Art of Data Science by Roger Peng
How to Be A Modern Scientist by Jeff Leek
配套参考书
the elements of data science 电子版下了一本 98 页
另外有个更全的 相关书籍的整理
安装r语言,安装interface Rstudio
安装git,安装github
基本的命令行,基本的git command
基本的hack skill ,比如说如何google/stack overflow
这里写图片描述

git add 新的文件
git add -u 更改的文件
git add -a 以上所有
git push 将文件push到github上
git checkout -b branchname 创建分支
git checkout master 回到主版本
在github网站上执行 pull request 将改变merge到其他branch

基本的markdown

哎呀 发现没有字幕也能听懂

R package 从CRAN网站上下载
available.package() 寻找package
install.package(“name”) 安装package
install.package(c(“name1”,”name2”))一次安装多个
或者Studio -》 tools -》 install
library(name)导入 R
search() 查看所有package

data science希望解决哪些问题

descriptive analyses 主要是画图?
exploratory analysis 数据之间的关系?e.g. sloan digital sky survey
inference analysis从部分样本中总结一个对全体样本的结论?
prediction analysis 比较富有挑战性
causal analysis 因果分析
mechanistic analysis

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值