1、EXCEL引用数据的格式:行:行,列:列,单元格:单元格
工作薄、工作表、单元格区域、单元格
单元格位置由 列号:行号表示
引用其他工作表的单元格 =sheet2!A1
=VLOOKUP(E2, A:B , 2 , FALSE)
以E2单元格为查找值,A:B是查找范围,2表示查找范围的顺序号,在AB两列取第二列上的单元格值,FALSE代表精确匹配。
2、表结构数据分析工具获取其他数据源的方式是引用,用ETL的方式。
3、不是所有的子查询都可替换成连接查询,但是所有的连接查询都可以替换成子查询,因为当子查询在where语句中且子查询带有聚合函数,就不可以转为连接查询了。
4、在样本量较小的情况下,如果总体标准差已经知道,样本统计量符合正态分布,可采用t分布。
5、卡方分布常用于方差检验。
6、中位数填充解决偏态分布。
6、皮尔逊相关系数,Pearson系数度量线性相关性,协方差/标准差的乘积。
r 的范围是-1到1,其中 [1,0)是负相关,[0,1]是正相关。 | r | = 1 表示完全相关。
r = 0 表示没有线性相关关系。 r在 [0.5,0.8) 的时候可以认为相关性一般。
7、Spearman相关系数,非数值数据的相关性。
8、逻辑回归模型不适用数值变量。
9、多维数据模型:需要满足维度和公共字段为父子关系。
10、动销天数反应了销售行为风险程度,不能反应销售好坏。
11、电商收入三大指标GMV:独立访客数(流量)、转化率、客单价(每个顾客平均购买价格),其中