拟解决问题-对BSA返回结果数据进行筛选获得候选基因
BSA返回的测序文件,将两个文件的SNPindex值与基因注释结合起来,这样就能直接使用Excel的筛选功能找到候选基因ID。两个.xlsx文件,比如Delta-SNPindex.xlsx和exonic_variant_function.xlsx
pd.merge(df1, df2, how = ‘inner’, on = [‘col1’, ’col2’ ‘col3’], indicator = True )
使用代码如下
该处使用的url网络请求的数据
import pandas as pd
#导入excel文件
filepath1 = "E:\yB\Delta_SNPindex.xlsx"
filepath2 = "E:\yB\exonic_variant_function.xlsx"
df1 = pd.read_excel(filepath1, sheet_name

本文介绍如何利用Python将BSA测序文件的SNPindex值与基因注释结合,通过Excel筛选功能找出候选基因。通过pd.merge进行数据合并,并设定筛选条件:SNPindex_mt=1且deltaSNPindex>=0.5,同时排除特定变异类型和同义突变,筛选后保存为m_12.xlsx。
最低0.47元/天 解锁文章
3337

被折叠的 条评论
为什么被折叠?



