Dataframe,数据框，按照含有指定列名的列表list来选择列数据

最新推荐文章于 2023-12-01 15:25:29 发布

原创最新推荐文章于 2023-12-01 15:25:29 发布 · 5.5k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#list #python #数据结构

代码小结同时被 2 个专栏收录

15 篇文章

订阅专栏

知识小结

5 篇文章

订阅专栏

本文介绍了如何利用Pandas库在Python中筛选DataFrame的数据。通过将需要的列名存储在列表中，然后直接应用到DataFrame上，可以方便地选取特定列。文中详细展示了从CSV文件读取数据，创建列表，再到筛选列的步骤，适合数据处理初学者参考。

系列文章目录

标准化处理数据和panda读取excel数据，保存数据

前言

主要就是自己经常会忘，或者和loc，iloc混淆了，在处理数据时，又经常用到，所以记载一下。
将需要筛选的几列数据的列名汇总成一个list，然后通过list筛选Dataframe，非常简单。

一、pandas是什么？

pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。

二、使用list筛选df列数据解决方案

SNP = pd.read_csv('new.csv')#加载原始数据
#SNP，数据框

#加载列表名称，我所需要的列表名称
SNP_name_58 = pd.read_csv('161AD_NC_assoc_58snp.csv')
#SNP_name_58 维度：（50,1），数据框格式

#先转换为list，数据框SNP_name_58只有SNP这一列。
SNP_name_58_list = SNP_name_58['SNP'].tolist()
#注意此时，SNP_name_58_list = ('rs***','rs***','rs***',************)

#直接套上list，即可筛选，非常好用
SNP_58 =SNP[SNP_name_58_list]