Pandas——②选择数据

Pandas——选择数据

python入门常用操作:https://blog.youkuaiyun.com/qq_33302004/article/details/112859327

 

pandas 具有非常丰富的数据筛选能力,可以支持多种个性化的筛选

dates = pd.date_range('20210125', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6,4)), index=dates, columns=['A','B','C','D'])
print(df,'\n')
# 1.定位一【列】,
print(df.A)
print(df['A'],'\n-----------------------------')

# 2.使用【切片】定位若干【行】
print(df[0:3])
print(df['20210125':'20210128'])
print(df['20210125':'20210125'],'\n--------------------------')

# 3.select by label: loc 使用[标签名]定位
print(df.loc['20210125'])
print(df.loc[:,'A'])
print(df.loc[:,['A','C']])
print(df.loc['20210125':'20210126',['A','C']],'\n--------------------------')

# 4.select by position: iloc ,index-local 使用标签[下标]定位,选择第1行第列行
print(df.iloc[3,1])     # 第三行第一位
print(df.iloc[[0,2,4],1:3])

# 5.mixed selection: ix,混合iloc(索引)和loc(标签)一起筛选
print(df.ix[:3,['A','C']])
print(df.ix['20210125':'20210126',0:3])

# 6.Boolean indexing: 使用判断做筛选
print(df)
print(df[df.A>8])

 

为了处理您提供的文本数据,我们可以逐步完成每个任务。以下是详细的步骤说明以及相应的Python代码示例: ### 一、将数据写入列表 首先我们将每一行作为一个元组加入到列表中,包括表头信息。 ```python data_list = [ ('name', 'physics', 'Python', 'math', 'english'), ('Google', 100, 100, 25, 12), ('Facebook', 45, 54, 44, 88), ('Twitter', 54, 76, 13, 91), ('Yahoo', 54, 452, 26, 100) ] print("List of tuples:", data_list) ``` ### 、将数据写入字典 接下来我们构造一个嵌套结构的字典,在这里最外层键是公司名称,值则是另一个描述各科成绩的小型字典。 ```python data_dict = {} for row in data_list[1:]: name = row[0] scores = {'physics':row[1],'Python':row[2],'math':row[3],'english':row[4]} data_dict[name] = scores print("\nDictionary structure:") from pprint import pprint # 漂亮打印模块 pprint(data_dict) ``` ### 三、将数据写入数据框 对于更复杂的数据分析任务来说,使用`pandas`库中的`DataFrame`更为方便。我们需要先安装该包 (`pip install pandas`) 然后按照以下方式进行转换: ```python import pandas as pd # 将list转为DataFrame column_names = list(data_list.pop(0)) # 取出第一项作为列名 df = pd.DataFrame(data=data_list, columns=column_names) print('\nDataframe:') print(df) ``` ### 四、将数据保存至Excel并读回 最后一步涉及到了外部存储媒介——这里是`.xlsx`文件格式。同样需要借助于`openpyxl`或者`xlsxwriter`(如果要支持更多特性)引擎配合pandas来完成这项工作。 ```python file_name = "company_scores.xlsx" sheet_name='Sheet1' # 写入excel 文件 with pd.ExcelWriter(file_name, engine='xlsxwriter') as writer: df.to_excel(writer,sheet_name=sheet_name,index=False) # 从 excel 中读取回来 new_df = pd.read_excel(file_name, sheet_name=sheet_name) print(f'\nRead from {file_name}:') print(new_df) ``` 以上就是对给定文本数据的操作指南了!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值