Pandas使用笔记

最新推荐文章于 2025-04-02 23:39:01 发布

prismformore

最新推荐文章于 2025-04-02 23:39:01 发布

阅读量129

点赞数

CC 4.0 BY-SA版权

分类专栏： Coding Industry

本文链接：https://blog.youkuaiyun.com/weixin_42242159/article/details/86536305

Coding 同时被 2 个专栏收录

5 篇文章

订阅专栏

Industry

2 篇文章

订阅专栏

本文介绍如何使用Pandas的str.split方法将数据框中的一列拆分为多列，包括参数详解及示例代码。同时，涵盖行选择、列选择、排序和查找元素等实用数据操作技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

把某一列分成两列

原文链接

Syntax: Series.str.split(pat=None, n=-1, expand=False)

Parameters:

pat: String value, separator or delimiter to separate string at.
n: Numbers of max separations to make in a single string, default is -1 which means all.
expand: Boolean value, returns a data frame with different value in different columns if True. Else it returns a series with list of strings.

输入：

# dropping null value columns to avoid errors 
data.dropna(inplace = True) 

# new data frame with split value columns 
new = data["Name"].str.split(" ", n = 1, expand = True)   # n=1代表只返回两列（一次split），n=-1代表返回所有列
  
# making seperate first name column from new data frame 
data["First Name"]= new[0] 
  
# making seperate last name column from new data frame 
data["Last Name"]= new[1] 
  
# Dropping old Name columns 
data.drop(columns =["Name"], inplace = True) 
  
# df display 
data

输出：
在这里插入图片描述

行选择和列选择

https://www.cnblogs.com/kylinlin/p/5231404.html

sort values

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')

Sort by the values along either axis

在某一列查找元素

To select rows whose column value equals a scalar, some_value, use ==:

df.loc[df['column_name'] == some_value]

To select rows whose column value is in an iterable, some_values, use isin:

df.loc[df['column_name'].isin(some_values)]

Dataframe 2 list

df[‘a’].tolist()