原版英文地址: link.
我根据上面的英文路径图,根据自己的理解进行了翻译,得到了下面的一张脑图,一是希望自己能按照这上面的进行查漏补缺,二也是为大家提供一个参考的依据。
上面的图好像不是很清楚,于是我转换成了文字的形式写在下面👇
-
基础知识
矩阵与线性代数
哈希函数,二叉树,大O难度
关系代数,数据库基础
数据联结方式:内、外、交叉、theta
CAP定理
列表数据
data frame and series
数据切分
OLAP、OLTP
多维数据模型
ETL
分析报告
半结构化数据:JSON & XML格式
非结构化数据:NoSQL
正则表达式
各服务供应商情况
环境设置 -
统计学
选取数据库:UCI库
描述性统计学(均值、中位数、幅度、标准差、方差)
探索性数据分析
直方图
百分位和异常值
概率论
贝叶斯理论
随机变量
累计分布函数(CDF)
连续分布(正态、泊松、高斯)
偏度