
数据处理
Jay777_
这个作者很懒,什么都没留下…
展开
-
dataframe选取特定行和列
pandas选取特定行和列选取行df= pd.read_csv('data.csv')df.loc[3:6] # 选取多行选取列data = df['column_name'] # 按照指定列名选取data = df[['column_name1', 'column_name2']] # 取多列data = df.iloc[:, 0:5] # 按位置取某几列取指定某行某列的元素# 取指定第2行第3列的元素data = df.loc[2][3]......原创 2020-06-29 09:46:06 · 52034 阅读 · 0 评论 -
DataFrame添加行
DataFrame添加行方法一:使用loc方法from pandas import *from random import *df = DataFrame(columns=('lib', 'qty1', 'qty2')) # 生成空的pandas表for i in range(6): # 插入一行 # i为行索引,即添加到i index的位置 df.loc[i] = [randint(-1, 1) for n in range(3)] df.loc['行名'] = [2,1,3原创 2020-06-19 14:09:40 · 3074 阅读 · 0 评论 -
dataframe重设index
dataframe重设index对数据进行筛选后,索引不是连续的情况# inplace代表原地修改,即修改原数据df# drop=True:原index会被丢弃,不会显示为一个新列df.reset_index(drop = True, inplace=True)# 或者用一个变量去接收修改后的dfdf = df.reset_index(drop = True)...原创 2020-06-19 14:08:09 · 1493 阅读 · 1 评论 -
dataframe按照某列排序
dataframe按照某列排序# inplace: 原地修改# ascending:升序df.sort_values(by="column_name" , inplace=True, ascending=True) # 按多列排序df.sort_values(["column_name1", "column_name2"] , inplace=True, ascending=True)原创 2020-06-19 14:07:02 · 33110 阅读 · 0 评论 -
dataframe删除重复的行
dataframe删除重复的行#去掉column1和column2列中重复的行,并保留重复出现的行中第一次出现的行norepeat_df = df.drop_duplicates(subset=['column1', 'column2'], keep='first')当keep=False时,就是去掉所有的重复行当keep=‘first’时,就是保留第一次出现的重复行当keep='last’时就是保留最后一次出现的重复行。...原创 2020-06-19 14:05:21 · 4673 阅读 · 1 评论