数据处理,目的是为了把抽样完的原始数据,转换成符合分析算法需求(哪些用户,哪些字段,哪些时间窗口),的标准化数据。
数据处理包括,1:数据审核(用户,字段,数据缺失,数据错误),2:缺失值处理(均值中位数固定值填充,正态随机,决策树算法),3:去极值(填充,丢弃),4:数据转换(归一化,z分数,对数转换)。
本文详细介绍了数据处理的四个关键步骤:数据审核、缺失值处理、去极端值及数据转换。通过这些步骤,可以将原始数据转化为适合算法分析的标准形式。
数据处理,目的是为了把抽样完的原始数据,转换成符合分析算法需求(哪些用户,哪些字段,哪些时间窗口),的标准化数据。
数据处理包括,1:数据审核(用户,字段,数据缺失,数据错误),2:缺失值处理(均值中位数固定值填充,正态随机,决策树算法),3:去极值(填充,丢弃),4:数据转换(归一化,z分数,对数转换)。

被折叠的 条评论
为什么被折叠?