python 多行排序,根据染色体号,位置信息排序,升序降序排序

Python实现多行按染色体和位置排序
在Python中,对文件按染色体编号和位置编号排序可通过自定义`sort`的`key`函数实现。例如,对染色体和位置进行正向排序,可以编写一个函数处理每一行,然后对列表应用排序。如果需要一列正序,另一列反序,只需在反向排序的列返回值前加负号。这允许灵活地对不同列进行升序或降序排序。

遇到一个问题是需要将文件按照染色体编号和位置编号进行排序,在shell中我们可以使用sort -V -k2,3 annovar.xls这种方式来进行排序,而在python中如果想要进行多行排序,就需要sort的key参数指定的函数返回一个元组或者列表来进行排序。

现在我们有一个染色体位置文件如下:

如果想要对上述的文件进行排序,那么key函数就可以像下面这样写:

def chrome_sort(key):
    '''
    染色体排序
    '''
    if key[0] == 'X':
        chrome = 24
    elif key[0] == 'Y':
        chrome = 25
    else:
        chrome = int(key[0])
    position = int(key[1])
    return (chrome,position)

使用这个函数,我们就可以将包含文件每一行的列表进行排序了,完整代码如下:

#!/usr/bin/env python
# -*- coding=utf-8 -*-
import sys
import os

def chrome_sort(key):
    '''
    染色体排序
    '''
    if key[0] == 'X':
        chrome = 24
    elif key[0] == 'Y':
        chrome = 25
    else:
        chrome = int(key[0])
    position = int(key[1])
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值