对比excel与python 的分列处理方式

Excel 分列

Excel中对数据进行分列是非常简单的。如下:在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  1. 选中需要处理的列 功能卡"数据",“分列"按钮,即出现设置弹窗 选"分隔符号”
  2. 点击下一步 左上部分,勾选"逗号"
  3. 点击下一步
  4. 最后看到结果预览,没问题,直接点击完成

pandas 分列

pandas对文本列进行分列,非常简单:

df = pd.DataFrame({'姓名':['张三', '李四','王五'] , 
                 "科目":['语文,100','语文,86','语文,96']})
df

在这里插入图片描述

res = df["科目"].str.split(',',expand= True)
res

在这里插入图片描述

重命名column 的名字就可以啦

df[["科目",'分数']]=res
df

在这里插入图片描述

DataFrame.str.split() :
对文本列分列,第一参数指定分隔符
参数 expand ,表示是否扩展成列,若设置为 True ,则分割后的每个元素都成为单独一列

=======================================================================

再来个复杂的需求

有时候,我们希望分割的内容,转化成行,需求如下:

在这里插入图片描述

EXCEL 操作

比如,第一行 张三 的科目中有3个元素,则分割结果 张三就有3行
使用Excel自带功能处理这需求就比较困难,我们使用PowerQuery来处理:
在这里插入图片描述

功能区"Power Query",点"从表/范围"
此时会启动 Power query 编辑窗口

在这里插入图片描述

点选 科目 整列
上方功能区"开始",“转换"区中,点选"拆分列”,选"按分隔符"

在这里插入图片描述

这里大部分设置与 Excel 自带功能基本一致
点开"高级选项",点选"拆分为"中的"行"

在这里插入图片描述

功能区"开始",最左边点按钮"关闭并上载",即可把结果输出会 Excel

=============================================================================

pandas操作

df = pd.DataFrame({'姓名':['张三', '李四','王五'] , "科目":['语文,数学,体育','语文,数学','语文,数学'] })
df

df.drop('科目', axis=1).join(
    df["科目"].str.split(',',expand=True).stack().reset_index(
    level=1, drop=True).rename("科目"))

在这里插入图片描述

此代码比较长,分步拆解一下:
df["科目"].str.split(',',expand=True)

在这里插入图片描述

df["科目"].str.split(',',expand=True).stack().reset_index(level=1, drop=True).rename("科目")

在这里插入图片描述

df.drop('科目', axis=1)

在这里插入图片描述
分布拆解更容易懂,大家可以自行用代码尝试下,这样更容易记得牢

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值