Python-数据处理之一

这篇博客记录了使用Python进行数据处理时的笔记,重点提到了OneHotEncoder,虽然它不严格属于传统的热编码,但作为编码技术的一种,值得关注。博主计划继续补充和完善相关的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
import numpy as np
data = pd.read_excel('data.xls')
data
#表的列属性
data.columns
#表的大小
data.shape
#对于某一列属性,是字典嵌套字典类型的,想取其中,某一个key的value,用apply:
data['better_price0'] = data['price'].apply(lambda x:eval(x)['better'].get('price0',-1))
#如果某一price0不存在,将会赋值为-1,接下来就是选择不为-1的那部分数据
data = data[data['better_price0']!=-1]
# #
#apply的另一处用法,用于切分字符串,split的用法,这个是当时间是:xxxx年xx月
data['year'] = data['time'].apply(lambda x:x.split('年')[0])
data['months'] = data['time'].apply(lambda x:x.split('年')[1])
data['month'] = data['months'].apply(lambda x:x.split('月')[0])
#如果时间:20150206...的时候,用下面:
data['year'] = data['time'].apply(lambda x:x[0:4])
#...
#在是用x.split()的时候,要注意x要是字符串类型
data['time'] &#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值