python2C 之 DataFrame列与行（index 和列相互转化，行列重命名）

原创已于 2023-06-01 16:00:27 修改 · 3.9k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pandas #python #开发语言

于 2022-12-07 13:34:00 首次发布

python2 之 Pandas、DataFrame 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了使用 Pandas 进行高效数据处理的方法，包括行列之间的转换、数据重塑、索引操作及排序等实用技巧。

部署运行你感兴趣的模型镜像

行列间的转化与拼接

一、将index 和每一列的数值相互转化

df.set_index(["Column"], inplace=True)

1. 将a列转为index列： set_index

2. 将index 转为列a：

使用之前可以将index重命名：df.index.name = 'aaa'

reset_index()

3. 使用drop参数设置去掉原索引

reset_index(drop=True)

2. 重命名

（1）在构造变量的时候进行命名。

dt = pd.DataFrame(t1), index = [```'], columns = [```])

创造DataFrame：

a = pd.DataFrame(np.ones(2), index = ['a1', 'a2'], columns = ['bbb'])

b = pd.Series(np.ones(2), index = ['a1', 'a2'])

（2）对index的名称进行命名

方法一：

a.index.name = 'aaa'

a.columns.name='bbb'

方法二：

a.columns =a.columns.rename("bbb")

a.index =a.index.rename("aaa")

创造DataFrame： a = pd.DataFrame(np.ones(4))

（2）对特定的行列进行命名

方法一：

dataframe.rename(columns = {"old1": "new1", "old2":"new2"}, inplace=True)

dataframe.rename(index={0: "x", 1: "y"})

dataframe.rename(index={0: "x"})

方法二：

DataFrame.index = [newName]

DataFrame.columns = [newName]

（3）创造DataFrame，并直接定义index，columns

pd.DataFrame(history_data.Data,index=history_data.Fields,columns=history_data.Times).T

（4） rename的高级用法：

DataFrame.rename（mapper = None，index = None，columns = None，axis = None，copy = True，inplace = False，level = None ）

其中dict可以进行简写

h = dict(zip(aaa.columns, aaa.index))

df = df.rename(columns=h)

position_stock_pct.rename(lambda x: x + '_pct', axis='columns')

二、双重索引：矩阵的index与columns 重新排列相互转化

stack 与 unstack

columns转为index：

df

df1 = df.stack()

双index 拆分转为columns

df1. unstack()

设置双索引，并针对特定索引进行转化

df1 = df.set_index(['trade_dt','s_info_windcode' ])

df2 = df1.unstack('s_info_windcode')

将双轴变为拆分：

dataall3.reset_index()

查看第一个索引：ind=rawdata2.index.levels[0]

将双轴进行相互转化/填充：swaplevel

stock_mv1.swaplevel(1, 0)

三、重新排列分类：用其中的数据定义index/columns

pivot

data_df.pivot(index='userNum', columns='subjectCode', values='score')

# index: 可选参数。设置新dataframe的行索引，如果未指明，就用当前已存在的行索引。

# columns：必选参数。用来设置作为新dataframe的列索引。

# values：可选参数。在原dataframe中选中某一列/几列的值，使其在新dataframe的列里显示。如果不指定，则默认将原dataframe中所有的列都显示，这里需要注意：为了将所有的值都显示出来，就会出现多层行索引的情况。

pd.melt

将columns变为一个维度

四、对行、列重新排序

对列进行重新排序：

col_new = ['泛消费', '周期', '地产基建', '大制造', '科技成长', '金融']

indus_pos_collect_ranked = indus_pos_collect.loc[:, col_new]

以行重新排序：

indus_pos_new = indus_pos_new.sort_index()

五、改变类别标签

df['grade'] = df['grade'].cat.set_categories(['very bad', 'bad', 'medium', 'good', 'very good'])

df['grade'].cat.set_categories(['very bad', 'bad', 'medium', 'good', 'very good'], inplace=True)

df = pd.DataFrame({"ohoh":[1,2,3, 4], "haha":['a', 'b', 'b', 'c']})

#将列转化为category类型

df["hihi"] = df["haha"].astype("category")

df['hihi'].cat.categories = ["very good", "good", "very bad"]

六、将index名称自动转为序号

time_chosen.reset_index(drop=True)

已完成

您可能感兴趣的与本文相关的镜像

Python3.9

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。