- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 4种数据去量纲化方法—标准化、归一化、正则化
对正项序列进行变换,原始序列中的每一个值比上所有值之和。将数据缩放到(0,1)范围内。首先计算出全体数据x的均值µ与标准差σ,然后将每个x带入公式进行标准化。主要目的将不同量级的数据统一转化为同一个量级。L2正则化,将每个样本缩放到单位范数,依照特征矩阵的行处理。将数据缩放到(0,1)范围内,且不改变数据的分布形状。用python对数据进行z-score标准化。用python对数据进行min-max标准化。即每行都转化为“单位向量”,会改变分布形态。用python对数据进行正则化。...
2022-08-02 15:35:55
8257
原创 【python】pandas.DataFrame实现“一行拆多行”和“多行并一行”
一行转多行稍微复杂一些,需要先将一个单元格中包含多个元素的长字符串根据分隔符切割,以含有最多个元素的行为准,分成对应个数的列,其余不足最多个数的行所余出列用null填充,分为多列后,再将行索引转变成列索引,一行数据就变成了两层结构多行数据,重置索引后与原数据合并即可。多行转一行就很简单,只需要定义一个拼接dataframe的值的函数,再将整个dataframe分组聚合拼接即可。httpshttpshttpshttpshttpshttpshttps。...
2022-07-18 15:38:42
8088
原创 statsmodels线性回归中的Jarque-Bera指标检验残差是否服从正态分布
统计学线性回归中的Jarque-Bera指标检验残差是否服从正态分布
2022-06-27 16:13:53
4197
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人