numpy
删除行:
data = np.delete(data, [1,2,3], axis=0)
删除123行数据
删除列:
data = np.delete(data, -1, axis=1)
删除最后一列数据
选取最大n个值的索引
a = np.argsort(data)
选取一个最大索引
a = np.argmax(data)
pandas
连接行:
data = pd.concat([a, b], axis=0)
注意index重复问题
data = data.reset_index(drop=True)
连接列:
data = pd.concat([a, b], axis=1)
参数需为DataFrame
读文件
data = pd.read_csv(path, sep='\t') #读tsv文件
data = pd.read_csv(path) #读csv文件
矩阵相关系数
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.concat([data, label], axis=1)
corrmat = data.corr()
f, ax = plt.subplots(figsize=(12, 9))
sns.heatmap(corrmat, vmax=.8, square=True)
本文详细介绍了使用NumPy进行数据删除、排序及选取最大值的操作方法,以及利用Pandas进行数据连接、读取文件和计算相关系数的具体步骤。通过本文,读者可以掌握NumPy和Pandas在数据科学中的基本应用。
458

被折叠的 条评论
为什么被折叠?



