系列文章目录
Dataframe,数据框,按照指定列名列表list来选择列数据
前言
主要就是自己经常会忘,或者和loc,iloc混淆了,在处理数据时,又经常用到,所以记载一下。
将需要筛选的几列数据的列名汇总成一个list,然后通过list筛选Dataframe,非常简单。
一、pandas是什么?
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、使用list筛选df列数据解决方案
SNP = pd.read_csv('new.csv')#加载原始数据
#SNP,数据框
#加载列表名称,我所需要的列表名称
SNP_name_58 = pd.read_csv('161AD_NC_assoc_58snp.csv')
#SNP_name_58 维度:(50,1),数据框格式
#先转换为list,数据框SNP_name_58只有SNP这一列。
SNP_name_58_list = SNP_name_58['SNP'].tolist()
#注意此时,SNP_name_58_list = ('rs***','rs***','rs***',************)
#直接套上list,即可筛选,非常好用
SNP_58 =SNP[SNP_name_58_list]
总结
提示:这里对文章进行总结:
别再忘了。

本文介绍了如何利用Pandas库在Python中筛选DataFrame的数据。通过将需要的列名存储在列表中,然后直接应用到DataFrame上,可以方便地选取特定列。文中详细展示了从CSV文件读取数据,创建列表,再到筛选列的步骤,适合数据处理初学者参考。
519

被折叠的 条评论
为什么被折叠?



