
爬虫
文章平均质量分 67
毒鸡蛋
这个作者很懒,什么都没留下…
展开
-
EzBioCloud 数据库爬虫
EzBioCloud public genome database 数据库爬虫EzBioCloud public genome database 数据库爬虫观察数据库爬虫爬取EzBioCloud public genome database 数据库爬虫因为这个数据库没有下载接口,且网页是动态加载的,所以使用selenium + bs4 的策略。观察数据库目的:获取红框内的信息https://www.ezbiocloud.net/genome/list?tn=Root爬虫爬取# -*- cod原创 2020-07-12 11:55:08 · 2702 阅读 · 1 评论 -
python爬虫爬取ONCOKB数据库
python爬虫爬取ONCOKB数据库简介代码简介爬取这个网站比较麻烦,他网速不快、又不能直接爬,所以我们用模拟浏览器先将网页保存到本地,然后在从本地爬取信息。(没想出好的方法,大家如果有什么高明的方法,欢迎指教!)步骤:1、你要自己准备好要爬取的gene列表(也就是代码中的 oncokb_gene_list_wait 文件)。例:也就是这里有的gene名2、通过链接进去,下载...原创 2020-04-17 14:20:20 · 2208 阅读 · 1 评论 -
python多线程爬取CKB数据库
多线程爬取CKB数据库python多线程爬取CKB数据库新的改变参考python多线程爬取CKB数据库新的改变本文针对ckb数据库里的Gene Variant Detail Transcript 信息进行爬取:1、进入网站https://ckb.jax.org/gene/grid,获取gene的名称及其相对应的链接。只有这些蓝色信息可以爬取。2、点开链接后,获取其Variant的名称及...原创 2020-04-12 17:36:40 · 1754 阅读 · 0 评论