What
- 数据分析和可视化平台
- 1993年出现
Why
- 免费
- 开源( 强大工具包,也可自己编写工具包 )
- 跨平台(Windows、Linux、Mac)
- 可完成数据分析涉及所有步骤(数据获取->数据清理->数据分析->结果报告->发布结果)
数据分析
- 探索性数据分析(作图)
熟悉数据、了解数据模式 - 统计推断
初始数据存在偏差或不确定性或噪音
基于数据得出结论+结论是错误的概率(一般<=5%成为有效) - 回归分析
机器学习
训练海量数据得出模型,然后用模型去预测。
发布结果
平台
- github
- R Pubs (rpubs.com)
包
扩展R基本功能的机制,集成众多函数
CRAN、Bioconductor、GitHub等
install.packages(包名)
install_github()