35、基因目录分析与元数据挖掘实战

基因目录分析与元数据挖掘实战

1. 基因目录数据获取与初步分析

在进行基因目录分析时,我们首先需要获取相关数据。这里我们以人类染色体 11 的已发布基因目录为例,从公共领域复制可用数据,并使用 Jython 脚本进行必要操作。

1.1 数据获取步骤

  1. 从指定网页下载包含基因目录的 CSV 文件。
  2. 将文件显示在 CSV 浏览器中进行初步查看。

以下是实现该步骤的代码:

from jhplot.io.csv import *
from jhplot import *
http='http://projects.hepforge.org/jhepwork/'
file='nature04632-s16-2.csv'
wget(http+'examples/data/'+file)
r=CSVReader(file,',')
SPsheet(r)

如果上述网页地址无法访问,可以使用镜像站点,将 http 地址替换为以下字符串:

http='http://jhepwork.sourceforge.net/'
# 或者
http='http://jwork.org/jhepwork/'

通过对该文件的可视化研究,我们发现每个基因符号由多个记录表征,每行代表一个基因的记录可视为一个“事件记录”,每个基因具有符号、名称、类别、位置、长度等信息。我们将以此文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值