import numpy as np
narr.zero()是初始化
narr=np.zeros((10,2))是初始化narr数组为十行两列
narr[0,:]=[0,1]赋值第零行的数值为【0,1】
narr[1,:]=[0,2]赋值第零行的数值为【0,2】
narr默认就是将narr数组打印输出
mtx=np.mat(narr):就是将narr数组转换成矩阵
max[:,0]就是打印mtx矩阵所有行,第零列的值
mtx[:,0].A就是将mtx矩阵转换成一个arr数组,并且输出第零列的值
range():既不含头,也不含尾
randim.ranint():含头含尾
narr.min(0):求第一列的最小值
narr.max(0):求第一列的最小值
narr.shape(0):取行数
narr.shape(1):取列数
np.tile(min,(10,2))将min的值复制10行,1列
diffMat**2:对diffMat的值进行求平方计算
diffMat**0.5:对diffMat的值进行开平方计算
narr.sum(axis=1):计算每行和,然后以数组的形式输出
distinct.argsort():有小到大排序,然后输出索引的值
model.save(sc,"./Kmeans_model"):保存模型
val sameModel=KMeansModel.load(sc,"./Kmeans_model"):从刚保存的文件中又读回来
list=['a','b','c']
list.index("c"):值为2,意思是获取索引的值。
for (i <- range (60*hours,0,-1)){}:从大到小,每次减少1,倒着循环。
什么是数据的归一化:
就是让数据之间的差别不是很大
为什么要归一化?
怎么归一化?