
药用数据库的数据提取与使用
文章平均质量分 61
主要介绍和记录提取一些主流的数据库并如何获取其中数据
贺俊宏
邮箱:recherhe@163.com
展开
-
利用python构建分子碎片库
基于分子文件构建分子碎片库。内嵌Brics, Recap, MacFrags三种算法。RECAP(Retrosynthetic Combinatorial Analysis Procedure):RECAP 是一种基于化学反应规则的分子切割方法,通过将分子沿特定的化学键进行断裂,生成更小的碎片。这些碎片可以帮助研究者更好地了解分子的结构和活性关系。BRICS。原创 2023-04-11 17:34:26 · 835 阅读 · 0 评论 -
已知一个靶点,如何获取旗下相关的生物实验,临床试验,以及上市药物数据.
写在开头1.靶点信息数据收集1.1 uniprot生物实验数据收集2.1 PUCHEMchembl总所周知,科研是基于数据的,数据是基础也同样是目的.但如何全面且详细地回顾和收集世界各地地往期工作就是困扰诸多科研工作的难题.但随着大量公开且庞大数据库的出现,似乎在为我们登上巨人的肩膀铸造了电梯.今天就以个人经验总结了一下如何搭乘这一部电梯.如有不足之处也请大家在评论区补充,感谢~本文章全程采用Poly [ADP-ribose] polymerase 1(parp-1)蛋白作为例子进行展示1.靶点信息数原创 2021-05-21 10:47:35 · 6583 阅读 · 4 评论 -
如何根据uniports号,爬取bindingDB的活性实验数据
上代码:import requestsimport jsonimport argparseimport timefrom pandas import json_normalizeparser = argparse.ArgumentParser(description="get ligands(BindingDB) by uniprots")parser.add_argument('--uniprots', '-u' , required=True, nargs='+', help='t原创 2021-05-21 09:46:09 · 1217 阅读 · 0 评论 -
如何依照靶点名称,找到chembl数据库中的相关实验数据
chembl提供了API(chembl_webresource_client)可以用来获取数据安装一下:pip install chembl_webresource_client废话少说,上代码:import pandas as pdfrom chembl_webresource_client.new_client import new_clientimport argparseparser = argparse.ArgumentParser(description="get chembl原创 2021-05-20 20:21:02 · 3290 阅读 · 0 评论 -
汇总药用数据库(Pubchem,bingdingDB,Chembl,ExcapeDB)数据
记载一下如何汇总4大数据库的数据原创 2021-05-21 10:18:00 · 2847 阅读 · 0 评论 -
根据chembl_id 查询蛋白分类信息
记录笨比上班生活又一天 没啥好说的直接上代码运行效果运行结果没啥好说的直接上代码以一个含有chembl target ID号的表格为起点,输入输入文件地址,chembl_id列名,以及输出文件地址chembl的api 分为多层 chembl_id>>>>>componen_id>>>>>protein_id# -*- coding: utf-8 -*-"""Created on Mon Sep 14 21:52:27 2020@au原创 2020-09-15 10:51:51 · 1796 阅读 · 0 评论 -
IC50、pIC50、EC50、ED50、Ki、Kd、KD、Ka、Km、Kon、Koff概念辨析
IC50:半抑制浓度(或称半抑制率),即IC50,对指定的生物过程(或该过程中的某个组分比如酶、受体、细胞等)抑制一半时所需的药物或者抑制剂的浓度。药学中用于表征拮抗剂(antagonist)在体外实验(in vitro)中的拮抗能力。pIC50:pIC50=-log(IC50)EC50:是指在特定暴露时间后,能达到50%最大生物效应对应的药物、抗体或者毒素等的浓度。药学中除了用于表征体外实验中(in vitro)激动剂(agonist)的激活能力外,还可用于表示达到体内(in vivo)最大生物效应.转载 2020-08-03 14:45:03 · 38675 阅读 · 0 评论 -
根据SID或者CID下载PUBCHEM数据库的smile信息(总结版)
PUBCHEM下载smile使用PUBCHEMbulk download功能把smile列加入到源文件中使用PUBCHEMbulk download功能参见我的一篇博文如何使用pubchem的bulk download功能把smile列加入到源文件中废话少说 上代码# -*- coding: utf-8 -*-"""Created on Wed Sep 11 10:16:11 2019@author: 86177"""import osimport pandas as pdimp原创 2020-08-01 17:33:37 · 6597 阅读 · 6 评论 -
结果数据调整并使用knime计算inchikey
首先我的数据结构是csv格式,columns为化合物id.值为化合物所对应的uniprots:现在想把格式转化为更方便后续处理的格式:上代码:import numpy as npimport pandas as pdimport osimport redef iter_files(path):# get all file_path under one folder f...原创 2019-12-02 20:27:59 · 1279 阅读 · 0 评论 -
获取bingingDB,Pubchem,chembl旗下的拥有uniprot的人蛋白靶点所对应的化合物活性信息,并构建神经网络.
爬取要用数据库数据原创 2019-11-19 11:14:13 · 4443 阅读 · 4 评论 -
利用蛋白的chembl ID爬取其synonyms
师姐的小要求,安排一下:import requestsfrom multiprocessing import Poolimport jsonimport pandas as pddef get_synonyms(ID): url = 'https://www.ebi.ac.uk/chembl/api/data/target/{}.json'.format(ID) ...原创 2019-12-16 21:24:49 · 1067 阅读 · 0 评论 -
数据统计并制作韦恩图
接之前算的的inchikey成果,统计并制作韦恩图.import numpy as npimport pandas as pdimport osimport redef cross_info(dose,uni_num): def iter_files(path):#get all file's path under one folder file_n...原创 2019-12-03 22:26:24 · 3862 阅读 · 0 评论 -
大量的pubchem实验获取化合物smile并归属各个实验.
目标:获取了多个pubchem实验的csv文件,需要获取其中化合物的smile.import pandas as pdimport osimport redef Summary_cid(path,out_path): # cid sumamry and batches to files that each has 500000 cid files = os.listdir(path...原创 2019-11-20 16:56:33 · 7426 阅读 · 7 评论 -
利用pubchem的 bulk download下载smiles 遇到的会自动删除重复cid的问题发现与解决
今天再利用含cid的文件再pubchem网站获取smiles时发现,网站会自行删除重复cid而只输出一个smile为解决这个问题想了如下办法.1.直接将获取到的txt转为csv与原csv合并:import pandas as pdimport sysdf = pd.read_csv(r'file')df_old = pd.read_csv(r'file_old')df_out = p...原创 2019-09-11 21:42:08 · 1944 阅读 · 0 评论 -
利用含PUBCHEM_CID的的csv文件获取assaysummary数据
import pandas as pdimport numpy as npimport osimport sysimport requestsdef download(url,file_name): s = requests.Session() response = s.get(url,stream=True) with open(file_name,'ab'...原创 2019-09-10 17:11:55 · 1227 阅读 · 0 评论 -
利用requests库进行爬虫简介
requests 的基本使用方式其实最常使用的方式也就事 get 和 post 分别用于获取和上传,即用于数据性网站和检索性网站.可用于requests库的 参数header形式为字典,表示所用的User-Agent 如:import requestsurl = "...原创 2019-09-05 12:48:33 · 450 阅读 · 0 评论 -
与PUG-REST不同用于获取所有pubchem数据的PUG-VIEW
PUG VIEW是一种PUG REST的特殊使用形式,其输出的内容包含rest中的substance,assay,compound页面所没有的信心,这也正是PUG VIEW的意义所在.PUG VIEW对每条单个的pubchem 记录进行汇总,而不在乎重复性.与PUG REST的已经经过整理了的数据有所不同.其输出格式有:JSON(P), XML, ...原创 2019-08-29 10:03:43 · 761 阅读 · 0 评论 -
pubchem的官方API - PUG REST的使用教程(持续更新)
以URL为基础的API分为4个部分input specification--------------------------------------------------------输入 operation specification--------------------------------------------------操作 output specification---...原创 2019-08-20 09:50:40 · 13246 阅读 · 9 评论