drop函数的用法
1.DataFrame.drop(self,labels = None,axis = 0,index = None,columns = None,level = None,inplace = False,errors =‘raise’ )
通过指定标签名称和轴,或者直接指定索引或列名称来直接删除行或列。
常用参数含义:
labels : 标签表示索引或列
axis : 指定轴,axis = 0(删除行) axis = 1(删除列)
index : 索引(行) labels, axis=0相当于index=labels
columns : 列 labels, axis=1相当于columns=labels
inplace :布尔类型,默认值为false。采用inplace=True之后,原数组名对应的内存值直接改变
2.drop([ ],axis=0,inplace=True)默认情况下删除某一行,在原来的数据上直接改变
shape函数的用法
pandas是python中处理csv文件常用的一个库
data.shape[0]输出行数
data.shape[1]输出列数
data.shape返回的元组
例子:
import pandas as pd
path = '西瓜数据集2.1.csv'
data = pd.read_csv(path, header=None)
print(data)
print('data.shape:', data.shape)
print('data.shape[0]:', data.shape[0])
print('data.shape[1]:', data.shape[1])
''' 0 1 2 3 4 5 6
0 色泽 根蒂 敲声 纹理 脐部 触感 好瓜
1 青绿 蜷缩 浊响 清晰 凹陷 硬滑 1
2 乌黑 蜷缩 沉闷 清晰 凹陷 硬滑 1
3 乌黑 蜷缩 浊响 清晰 凹陷 硬滑 1
4 青绿 蜷缩 沉闷 清晰 凹陷 硬滑 1
5 浅白 蜷缩 浊响 清晰 凹陷 硬滑 1
6 青绿 稍蜷 浊响 清晰 稍凹 软粘 1
7 乌黑 稍蜷 浊响 稍糊 稍凹 软粘 1
8 乌黑 稍蜷 浊响 清晰 稍凹 硬滑 1
9 乌黑 稍蜷 沉闷 稍糊 稍凹 硬滑 0
10 青绿 硬挺 清脆 清晰 平坦 软粘 0
11 浅白 硬挺 清脆 模糊 平坦 硬滑 0
12 浅白 蜷缩 浊响 模糊 平坦 软粘 0
13 青绿 稍蜷 浊响 稍糊 凹陷 硬滑 0
14 浅白 稍蜷 沉闷 稍糊 凹陷 硬滑 0
15 乌黑 稍蜷 浊响 清晰 稍凹 软粘 0
16 浅白 蜷缩 浊响 模糊 平坦 硬滑 0
17 青绿 蜷缩 沉闷 稍糊 稍凹 硬滑 0
data.shape: (18, 7)
data.shape[0]: 18
data.shape[1]: 7
'''
sorted函数的用法
sorted()作为python内置函数之一,该功能就是对序列(列表,元祖,字典,集合,还包括字符串)进行排序。
sorted()函数的基本语法格式如下:
list=sorted(iterable,key=None,reverse=False)
其中,iterable表示指定的序列,key参数可以自定义排序规则,reverse参数指定以升序(False,默认)还是降序(True)进行排序
sorted()函数会返回一个排好序的列表
,注意,key参数和reverse参数是可选参数
与sort函数的区别
对数组
a = [3, 2, 4]
sorted(a)
print(a)
print(sorted(a))
[3, 2, 4]
[2, 3, 4]
对元组
a = (3, 2, 4)
print(sorted(a))