
Python
TIAN_R
数据挖掘程序媛
展开
-
scikit-learn官方文档-preprocessing data(数据预处理)
一、标准化,均值和方差缩放 数据集的标准化是许多在scikit-learn中实现的机器学习估计器的普遍要求。如果单个特征或多或少看起来不像标准正态分布数据,则它们的性能可能会很差。标准正态分布的定义:平均值和单位方差为零的高斯。 在实践中,我们经常忽略分布的形状,而只是通过删除每个特征的平均值来变换数据以使其居中,然后通过将非恒定特征除以它们的标准偏差来缩放它。 例如,学习算法的目标函数中使用的...翻译 2020-04-05 22:09:42 · 1106 阅读 · 0 评论 -
Python中批量导入json文件
Python中批量导入Json文件 path='D:\data' filelist = os.listdir(path) fileIndex = [] for i in range(0 , len(filelist)): index = filelist[i].split(".")[0] fileIndex.append(int(index)) for j in range(1 , l...原创 2019-10-29 11:52:56 · 1411 阅读 · 0 评论