Python pandas 染色体 SNP 位点提取 并排序

本文介绍如何利用Python的Pandas库读取并处理基因型数据文件,具体包括读取表格数据、筛选特定染色体上的位点、按位置排序及导出CSV文件的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
from pandas import DataFrame as df

f = open('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\1177genetype_hapmapcp1_18_01.txt')
d0 = pd.read_table(f, sep = "\t") #header 默认为第一行
d0.shape  #展示数据框的  行数和列数,如果数据为1,则对sep重新设置进行调节
d01 = d0[d0.chrom == 1]  #,提取1号染色体上的所有位点,染色体1 不可加‘’,以为已经为字符串型,等同于d02 = d0[d0.iloc[:,2] == 1]
print(d01)
d01.head()
d02 = d01.sort_values(by= 'pos')    #按照POS排序
d02.head(20)
d02.shape           #查看数据的  行数、列数
d02.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom1.csv")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Bio Coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值