pandas将一列分割成多列

最新推荐文章于 2024-06-08 22:04:16 发布

原创最新推荐文章于 2024-06-08 22:04:16 发布 · 5.4k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#python #jupyter #pycharm

python问题解答专栏收录该内容

1 篇文章

订阅专栏

该博客展示了如何使用pandas库处理CSV文件中的‘消费时间’列，通过map和lambda函数按空格拆分出日期和时间两列，从而进行数据精细化管理。

示例数据

import pandas as pd
from pandas import Series,DataFrame
consum = pd.read_csv('./consum.csv',encoding='ANSI')
consum[["消费时间"]]

要将“消费时间”这一列按照空格分割

#拆消费时间
consum["日期"]=consum["消费时间"].map(lambda x:x.split(' ')[0])
consum["时间"]=consum["消费时间"].map(lambda x:x.split(' ')[1])
consum[['时间','日期']]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冷烬亿下

关注关注

6
点赞
踩
31

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

一文速学(二十二)-数据分析之Pandas实现一列切分为多列

master_hunter的博客

11-22

3828

pandas专栏将pandas数据处理的函数以及一些功能都写的基本完善了，现在一些工作就是查漏补缺了。我会将我在实际项目上遇到的一些将pandas实现的较为复杂的功能总结为各个小文章，作为以后集成做开源项目作准备，这样以来数据分析的基础就很牢固，Pandas数据分析系列专栏已经更新了很久了，基本覆盖到使用pandas处理日常业务以及常规的数据分析方方面面的问题。

Python Pandas：DataFrame 一列切分成多列、分隔符切分选字段

AcWare 学习笔记

12-10

1万+

Python Pandas：DataFrame 一列切分成多列、分隔符切分选字段

3 条评论您还未登录，请先登录后发表或查看评论

3 条评论

2301_76149789 2023.01.05
谢谢您！困扰了好久的问题解决了，之前也有上网找过但是没有这么好的方法[face]emoji:054.png[/face]

Passerby_Wang 2022.07.19
写得也太详细了吧，学到了好多也欢迎博主来我这里指点一二呀[face]emoji:005.png[/face][face]emoji:005.png[/face][face]emoji:005.png[/face]

weixin_51989735 2022.06.07
请问改完怎么储存到原先的文件里？

Pandas：⼀列拆分为多列

LuckyTHP

04-27

1471

假设dataframe中有⼀列数据为如下形式：需要将YEAR_UNIT_DEPOSIT_PRO这⼀列的数据按照指定分隔符‘|’拆分为12列，并拼接到原始数据中⽣成新的dataframe。⽅法如下：数据拆分、拼接 gjj_pro = gjj_pboc['YEAR_UNIT_DEPOSIT_PRO'].str.split('|', expand=True) # 将数据按‘|’拆分 gjj_pro_col_len=gjj_pro.shape[1]#拆分出的列数 new_names = ['gjj_pro

pandas如何将一行拆分为多行，一列拆分为多列

weixin_44214830的博客

11-04

1万+

今天在工作中遇到要将pandas数据框的一行拆成多行，和一列拆为多列的需求，一台服务器中可以有多个网卡，每个网卡都有状态，通过网卡的上下行流量。下面以一组“数据”为例，来说一下pandas如何将一行拆分为多行，一列拆分为多列。需求如下图思路： 1.先将(0,c)拆成一个数据框 2.再将新数据框拆成4列(list1,list2,list3,list4) 3. 将原始数据框的c列删除，合并两个数据框 import numpy import pandas as pd from tab..

Pandas技巧：将一列分隔成多个列

opp003的博客

10-27

1万+

项目中遇到一个问题，搜集的数据只有一列，每行的数据都是通过特殊字符分隔，现在需要将其分隔成多个列。原始数据如下： 0 0 155,NA,0,10,-99999,18,18,18,04,NA,0,-99999... 1 728,NA,24.1,74.81,-9999,18,18,18,-99999,... 这是前两行的数据。原本使用特殊字符分隔的，这个好处理，只需通过string的repl...

python pandas将一列拆分为多列

qq_27866857的博客

01-09

4276

import pandas as pd df = pd.DataFrame([["A006, R079, 00-00-04, 5 AVE-59 ST"]]) print(df) df2 = pd.DataFrame(df[0].str.split(',').tolist()) print(df2) 0 0 A006, R079, 00-00-04, 5 AVE-59 ST 0 1 2 ...

Pandas实现一列数据分隔为两列

09-16

补充一下，有时我们需要将一列数据中的每一行拆分成多行，例如，如果数据包含多个地址或者电话号码，我们可以使用`str.split()`结合`stack()`和`reset_index()`方法来实现。假设我们有以下DataFrame： ```python ...

pandas某一列中每一行拆分成多行的方法

dongcheng 的博客

11-29

2万+

在处理数据过程中，常会遇到将一条数据拆分成多条，比如一个人的地址信息中，可能有多条地址，既有家庭地址也有工作地址，还有电话信息等等类似的情况，实际使用数据的时候又需要分开处理，这个时候就需要将这一条数据进行拆分成多条，以方便使用。在pandas中如何对DataFrame进行相关操作呢，经查阅相关资料，发现了一个简单的办法， info.drop([‘city’], axis=1).join(inf...

Pandas：一列拆分为多列

opp003的博客

05-08

1万+

假设dataframe中有一列数据为如下形式：需要将YEAR_UNIT_DEPOSIT_PRO这一列的数据按照指定分隔符‘|’拆分为12列，并拼接到原始数据中生成新的dataframe。方法如下： # 数据拆分、拼接 new_names = ['gjj_pro_' + str(x + 1) for x in range(12)] # 为新生成的列取名 gjj_pro = gjj_...

pandas将一列拆分为3列_Pandas，DataFrame：将一列拆分为多列

weixin_39723678的博客

12-30

1525

I have the following DataFrame. I am wondering whether it is possible to break the data column into multiple columns. E.g., from this:ID Date data6 21/05/2016 A: 7, B: 8, C: 5, D: ...

pandas.str.split - 一列分多列

heianduck的博客

12-10

4187

昨天我在逛优快云问答的时候，看见有人问起panda拆分单元格成多行的事，我今天就记录下，分为“一列分多列” 以及 “一列分多行”。每一行分的列数相同(即分隔符数目一致) import pandas as pd data = pd.read_excel("normal_same_split.xlsx","Sheet1") data #去除"上课地点"列 split1 = data.drop("上课地点",axis=1) # 分列 split2 = data['上课地点'].str.split

pandas 内置str函数，轻松拆分一列数据为多列

A_pinkpig的博客

04-08

1万+

读入数据，name列可以由‘-’符号分割出两列。 data = pd.read_csv('D:/test.csv', encoding='gbk') data 执行series内置函数str.split，得到每一个单元格的分割列表。 data['name'].str.split('-') 添加一个参数expand=True，将列表分开，得到两列。 data['name'].str.spli...

Pandas一列分成两列

dta0502的博客

10-07

2万+

文章目录分割成一个包含两个元素列表的列分割成两列，每列包含列表的相应元素分割成一个包含两个元素列表的列对于一个已知分隔符的简单分割（例如，用破折号分割或用空格分割） .str.split()方法就足够了。它在字符串的列（系列）上运行，并返回列表（系列）。 >>> import pandas as pd >>> df = pd.DataFrame({'AB...

Python Pandas list(列表)数据列拆分成多行的方法

weixin_42098295的博客

06-08

1792

print("\n使用 repeat 和 numpy 的 concatenate 拆分成多行:\n", df_expanded)print("\n通过 apply 和 pd.Series 拆分成多行:\n", result)print("\n使用 reindex 和 assign 拆分成多行:\n", result)print("\n创建新的列表并构造 DataFrame:\n", result)print("\n使用 numpy 高性能实现:\n", result)

pandas 列拆分多列

windows_oracle的专栏

07-31

1831

pandas分列

xu_xiaoxu的博客

10-26

1745

data.insert(1,'city',data['address']) #先复制原来的列 data["address"] = data["address"].map(lambda x:x.split()[0]) #分别处理新旧两列 data["city"] = data["city"].map(lambda x:x.split()[1]) ...

pandas 如何分割字符

最新发布

09-10

<think> 我们正在处理的是如何将一列数据分成两列。参考之前的引用，特别是引用[2]和引用[3]，我们可以总结出两种主要方法：方法1：使用`str.split()`并配合`.str`访问器，将分割后的列表元素直接赋值给新列。方法2：使用`str.split()`的`expand=True`参数将分割后的结果扩展成多列，然后赋值给新列。具体步骤：方法1（参考引用[2]）：假设有一列'AB'，包含类似'A1-B1'的字符串，我们想分成两列'A'和'B'。代码示例： df[['A', 'B']] = df['AB'].str.split('-', expand=True) 或者（使用n=1限制分割次数）： df[['A', 'B']] = df['AB'].str.split('-', 1, expand=True) 方法2（参考引用[3]）：另一种方式是利用`str.split()`返回的扩展DataFrame，然后进行赋值。 split_df = df['C'].str.split('_', expand=True) df['C1'] = split_df[0] df['C2'] = split_df[1] 或者更简洁地： df[['C1', 'C2']] = df['C'].str.split('_', expand=True) 注意：expand=True会返回一个DataFrame，每一列对应分割后的一个部分。如果分割后的部分数量不一致，缺失的部分会用NaN填充。详细代码示例：假设我们有一个DataFrame如下： import pandas as pd df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2', 'A3-B3-B4']}) 如果我们只想按第一个'-'分割成两列（即使后面还有'-'，也不继续分割），我们可以指定n=1： df[['A','B']] = df['AB'].str.split('-', 1, expand=True) 这样，第三行'A3-B3-B4'会被分割成'A3'和'B3-B4'。如果我们不指定n，那么会根据所有的分隔符分割，并且如果分割后的数量超过两列，我们只取前两列会丢失后面的数据，所以需要根据需求选择。另外，如果原数据不是字符串类型，需要先转换为字符串类型再分割： df['AB'] = df['AB'].astype(str) 现在我们根据引用[2]和引用[3]的示例，给出一个完整的代码示例。示例1（使用expand=True）： df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']}) # 使用split分割，并扩展为两列 df[['A','B']] = df['AB'].str.split('-', expand=True) 示例2（使用.str访问器，但这种方法要求分割后每个元素数量一致，否则会报错）： # 这种方法在分割后每个元素数量不一致时会报错，所以建议用expand=True # 但如果确定分割后每个都是两个元素，可以用如下方式： df['A'] = df['AB'].str.split('-').str[0] df['B'] = df['AB'].str.split('-').str[1] 但是，当分割后元素数量不一致时，上述方法会取第一个和第二个，第三个及之后的会被忽略，且如果某个元素分割后不足两个，那么第二个会得到NaN。因此，推荐使用expand=True方法。另外，引用[3]中还有一种方式： xx["C"], xx["D"] = df['C'].str.split('_', expand=True).values.T 这种方法也是可行的，但不如直接赋值给两列直观。总结步骤： 1. 确定要分割的列，假设列名为'col'。 2. 确定分隔符，假设为'-'。 3. 确定分割次数（可选），比如只分割一次（n=1）或者全部分割（不指定n）。 4. 使用`str.split(分隔符, n, expand=True)`进行分割，并将得到的DataFrame赋值给新的列（可以一次赋值多个列）。注意事项： - 新列的数量需要和分割后的列数一致，否则会出错。如果不确定分割后的列数，可以先分割并查看最大分割数。 - 如果原列中有缺失值（NaN），分割会出错，需要先处理缺失值。代码： # 创建示例数据 df = pd.DataFrame({'data': ['a-b', 'c-d', 'e-f-g']}) # 方法1：分割成两列（按第一个分隔符分割） # 这里我们指定n=1，表示只分割一次，这样会得到两列 df_split = df['data'].str.split('-', 1, expand=True) # 将分割后的两列重命名并添加到原DataFrame df[['col1','col2']] = df_split # 方法2：不限制分割次数，但是只取前两列 # 注意：这样第三行'g'会被丢弃 df[['col1','col2']] = df['data'].str.split('-', expand=True).iloc[:,0:2] 如果分割后列数不确定，我们可能需要根据最大列数来创建新列，但通常我们只关心前几列。因此，针对用户的问题“使用pandas将一列分开成两列的方法”，我们主要采用指定分割次数（n=1）的方法，这样可以确保分割成两列（即使字符串中有多个分隔符，第二个及之后的会保留在第二列）。下面给出一个通用的代码模板： import pandas as pd # 假设df是要处理的数据框，'original_column'是要分割的列名 # 分隔符为sep，这里假设为逗号（,） sep = ',' # 分割成两列，只分割一次 df[['new_col1', 'new_col2']] = df['original_column'].str.split(sep, 1, expand=True) 如果原始列中有NaN，我们需要先填充NaN或者删除NaN行，否则split会报错。我们可以这样处理缺失值： # 用空字符串填充缺失值，这样split后两列都是空字符串（或者根据需求处理） df['original_column'] = df['original_column'].fillna('') 然后进行分割。最后，生成相关问题。 </think> ### 使用Pandas将一列数据分割成两列的方法在Pandas中有两种常用方法将单列数据分割为两列： #### 方法一：`str.split()` + `expand=True`（推荐）这是最简洁高效的方式，特别适合简单分隔符场景： ```python import pandas as pd # 创建示例数据 df = pd.DataFrame({'combined': ['A1-B1', 'A2-B2', 'A3-B3']}) # 使用分隔符'-'分割成两列 df[['col1', 'col2']] = df['combined'].str.split('-', expand=True) print(df) ``` 输出： ``` combined col1 col2 0 A1-B1 A1 B1 1 A2-B2 A2 B2 2 A3-B3 A3 B3 ``` 关键参数说明： - `expand=True`：将分割结果扩展为DataFrame列 - `n=1`：限制分割次数（可选）[^2] #### 方法二：`.str`访问器索引适合需要保留中间结果或处理列表数据的场景： ```python # 创建含列表的列 df = pd.DataFrame({'combined': [['A1', 'B1'], ['A2', 'B2']]}) # 通过索引访问列表元素 df['col1'] = df['combined'].str[0] df['col2'] = df['combined'].str[1] ``` #### 处理缺失值和异常数据实际应用中需增加容错处理： ```python # 安全分割（处理缺失值） df[['col1', 'col2']] = ( df['combined'] .fillna('') # 填充空值 .str.split('-', 1, expand=True) # 限制分割1次 ) # 添加默认值 df['col2'] = df['col2'].fillna('N/A') ``` #### 复杂分隔符处理对于不规则分隔符（如多个空格）： ```python # 正则表达式分割 df[['col1', 'col2']] = ( df['combined'] .str.split(r'\s+-\s+', expand=True) # 处理" A1 - B1 "格式 ) ```