Pandas玩转数据（六) -- 通过apply对数据进行处理

最新推荐文章于 2024-07-24 09:39:17 发布

原创最新推荐文章于 2024-07-24 09:39:17 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

python 专栏收录该内容

19 篇文章

订阅专栏

Python3数据科学汇总： https://blog.youkuaiyun.com/weixin_41793113/article/details/99707225

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

ls ..\homework

#查看homework文件夹下的目录

df = pd.read_csv('../homework/apply_demo.csv')

df.head() ##读入数据后，查看前5行

df.size ##查看数据的个数，感觉不如shape直接,但size显示的是m*n的个数

df.shape ##查看数据的形状

df.info() ##查看数据的信息 df.info也可以运行哦，会有不一样的结果

s1 = Series(['a']*7978) #7978个全是'a'的Series

df['A'] = s1 ##给df造属性

df.head()

df['A'] = df['A'].apply(str.upper) ##通过apply把字母全变大写

df.head()

df['data'][0].strip().split(' ') #去掉头尾的空格，以中间的空格分隔

df['data'][0].strip().split(',') #用','分隔

l1 = df['data'][0].strip().split(' ')

l1[1], l1[3],l1[5]

def foo(line):
    items = line.strip().split(' ')
    return Series([items[1], items[3], items[5]])

df_tmp = df['data'].apply(foo) ##通过apply使用函数分隔

df_tmp = df_tmp.rename(columns={0:"Symbol", 1:"Seqno", 2:"Price"})#给属性名重命名

df_tmp.head()

df.head()

df_new = df.combine_first(df_tmp) ##加入df_new中没有，df_tmp存在的属性列

df_new.head()

del df_new['data'] ##删除df_new中的'data'属性列

del df_new['A'] ##删除'A'属性列
df_new.head()

df_new.to_csv('../homework/demo_duplicate小白.csv') ##生成csv到homework目录下

ls ..\homework ##查看homework目录，验证是否生成

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。