1、归一化
1.1简单处理列表
#归一化处理
raw = [0.07, 0.14, 0.07]
norm=[float(i)/max(raw) for i in raw]
print(norm)
1.2 处理嵌套列表:
#归一化处理
raw = [[0.07, 0.14, 0.07],[1,2, 3]]
norm=[]
for i in range(len(raw)):
norm.append([float(j)/max(raw[i]) for j in raw[i]])
print(norm)
2、查看字符串数据
一些csv文件读取的数据,往往是数字和字符串混在一起的,如何string类型的数据不多,可以通过以下代码来查看:
##
Counter(X.dtypes.values)
X.select_dtypes(include=['O']).columns