自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(147)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据处理代码

(2)使用pubchempy包下载药物信息。

2025-03-28 15:41:23 118

原创 解析DrugBank数据库数据|Python

DrugBank是一个综合性的生物信息学和化学信息学数据库,专门收录药物和靶点的详细信息。它由加拿大阿尔伯塔大学的Wishart 研究组维护,提供化学、药理学、相互作用、代谢、靶点等多方面的药物数据。DrugBank 结合了实验数据和计算预测,广泛应用于药物研发、精准医疗、生物信息学研究等领域。

2025-02-19 22:11:14 989

原创 解析Uniprot数据库数据|Python

UniProtKB提供蛋白质序列、物种来源、功能等注释,并引 入注释评分来表示蛋白质注释完备程度和研究的丰富程度。

2025-02-19 19:47:26 646

原创 分子指纹的学习|Rdkit

Morgan指纹(Circular fingerprints):基于分子的拓扑结构和半径参数生成的二进制指纹,可以用于描述分子的结构和相似性。MACCS指纹(MACCS keys):基于分子的结构和功能团片段生成的二进制指纹,可以用于进行药物相似性和虚拟筛选。

2025-02-11 14:29:13 995

原创 在本地部署 DeepSeek 模型(Ollama + Chatbox)

DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私。

2025-02-10 20:43:57 1186

原创 Ubuntu 24.04 LTS系统安装Docker踩的坑

本文提供了一步一步的指南来在Ubuntu24.04系统上安装和启动Docker。

2025-01-08 17:46:15 2150 5

原创 FingerprintSimilarity和BulkTanimotoSimilarity的区别

化合物的指纹对于使用计算机考虑化合物的相似性是必需的。已经提出了各种评估方法,但是最常用的评估方法称为“ Tanimoto系数 ”。相似性原理(similar property principle)指出,总体相似的分子应具有相似的生物活性。

2024-11-15 17:35:37 401

原创 Blast+Aspera的安装与使用以及PSSM生成与解析

本文介绍了如何在Linux上安装和使用Blast+Aspera,感兴趣的朋友进来看一看瞧一瞧呀!

2024-10-24 15:58:28 1055

原创 如何得到两个蛋白质序列的一致性和相似性

identity指的是对应位置上相同残基的数目占总长度的百分数。similarity指的是对应位置上相同和相似的参基占总数的百分数。

2024-10-21 11:26:42 4162 1

原创 最新版FragPipe安装和使用教程

然后我们就看到了如下的界面,我们要配置MSFragger和Python环境,MSFragger可以在右边按钮直接下载,填写完基本信息之后下载,python环境的话,下载一个Anaconda。,然后找到base环境下的python路径就可以,或者新建一个python环境,这里的python要求是 Python 3.9, 3.10, or 3.11,不是这些版本都不行。,下载第二个包含有Java环境的,第一个要配置Java环境,很麻烦。第一步,假如我有一批原始的raw文件,然后根据图示操作即可。

2024-08-08 20:39:15 1235 1

原创 Python求均值,方差,标准差

numpy 计算的是总体标准差,参数ddof = 0;pandas 计算的是样本标准差,参数ddof = 1

2024-07-18 16:04:54 1172

原创 配置服务器

2024-07-17 15:09:37 1113

原创 Lasso回归学习

LASSO,全称Least absolute shrinkage and selection operator,是由统计学家Robert Tibshirani于1996年提出的一种回归分析方法。它通过在损失函数中加入L1正则化项,实现对模型参数的惩罚,使得一部分参数趋于零。这种稀疏性的特点使得LASSO回归在高维数据集中具有出色的性能。

2024-07-12 11:26:10 1439

原创 【白菜基础】初识蛋白质组学

蛋白质组学是基于高特异性、高灵敏度质谱仪,对特定生物样本中的全部蛋白质进行精确定性和定量的过程。

2024-04-07 20:57:07 1581

原创 【白菜基础】蛋白组学之生信分析(1)

通过MaxQuant分析获得的结果包含大量的生物信息学数据,例如蛋白质定量、修饰、蛋白质组成等。这些数据可以通过不同的生物信息学分析方法进行进一步的处理和解释:蛋白质鉴定和定量分析、通路和网络分析、功能富集分析等。

2024-04-07 20:22:08 9441 1

原创 【文献阅读】Bioorthogonal in situ assembly of nanomedicines as drug depots for extracellular drug delivery

这篇文章主要介绍了一种生物正交原位组装纳米药物的策略,用于在肿瘤区域内形成药物库,以增强药物在肿瘤组织中的滞留和富集,从而提高癌症治疗的疗效。该策略利用微环境中的轻微酸性诱导纳米颗粒表面的半胱氨酸暴露,随后半胱氨酸与另一个相邻纳米颗粒的2-氰基苯并噻唑基团发生生物正交反应,形成微米级药物库,以增强药物的滞留和富集。这种纳米药物的原位组装策略显著提高了针对细胞外靶向药物的抗转移疗效,并实现了多种药物的同时增强滞留和持续释放,用于联合混合化疗免疫疗法,最终引发强效的抗肿瘤免疫反应。这种纳米药物的原位组

2024-03-27 16:00:23 1501 3

原创 【文献阅读】What does AlphaFold mean for drug discovery?

作为 RoseTTAFold 的一个案例研究,他的团队预测了与 IL-12 受体结合的 IL-12 细胞因子的结构,这是确定干预相互作用的方法的关键一步。DeepMind 的 Kathryn Tunyasuvunakool 表示:“我们的感觉是,如果你有非常高置信度的预测,[分子对接]可能值得一试,但总的来说,我们预计需要更多的工具开发才能成为可靠​​的程序。“我们不会收拾好玩具回家。这些包括蛋白质配体结构的预测,变构口袋的可药性,蛋白质-蛋白质相互作用和RNA靶点,以及疫苗免疫原和新生治疗蛋白的设计。

2024-03-25 15:57:47 720

原创 【文献阅读】AlphaFold touted as next big thing for drug discovery — but is it?

这篇文章主要讨论了AlphaFold对蛋白质结构的预测以及Recursion公司利用AI工具MatchMaker进行药物发现的情况。文章提到了一些科学家对AlphaFold在药物发现中的潜力持乐观态度,但也有人对其影响持谨慎态度。同时,还涉及到其他公司和研究团队在这一领域的探索和努力。

2024-03-22 15:02:45 908

原创 【文献阅读】Big data and benchmarking initiatives to bridge the gap from AlphaFold to drug design

最近的一项研究证实了AF2结构对于已知配体的回顾性对接研究效果不佳的结论,但有趣的是,他们发现AF2结构在前瞻性的虚拟筛选工作中取得了更好的结果。这一丰富的数据库包含了来自结构基因组学项目(如NIH蛋白质结构倡议)的成千上万个结构,该项目专门致力于增加“新折叠”的结构数量,为开发预测蛋白结构的计算方法提供了关键的训练数据集。这一知名的虚拟筛选工具。即使在预测结构中确定了可用于药物开发的口袋【pocket】,其内部的侧链也必须采取精确的构象排列,以适应给定的小分子配体,但这通常是无法正确预测的。

2024-03-21 22:18:16 954 1

原创 dataframe处理

目的:截取两个dataframes一样的长度,拼接起来之后,随机打乱行。

2024-03-10 20:36:48 396

原创 Transformer学习(一)

学习了文本嵌入层的作用:无论是源文本嵌入还是目标文本嵌入,都是为了将文本中词汇的数字表示转变为向量表示, 希望在这样的高维空间捕捉词汇间的关系。学习并实现了文本嵌入层的类:Embeddings初始化函数以d_model: 词嵌入维度, 和vocab:词汇总数为参数,内部主要使用了nn中的预定层Embedding进行词嵌入。在forward函数中,将输入x传入到Embedding的实例化对象中, 然后乘以一个根号下d_model进行缩放, 控制数值大小。它的输出是文本嵌入后的结果。

2024-03-02 22:20:51 1215

原创 日常科研中经常使用的命令

记录科研过程中遇到的Linux命令!

2024-03-02 10:27:54 910

原创 学习GTEx数据库

组织类型(54):GTEx数据库简介(1) - 知乎 (zhihu.com)TCGA、ICGC、GTEx 数据库都是啥?- 知乎 (zhihu.com)GTEx:基因型和基因表达量关联数据库-优快云博客。

2023-11-05 12:08:38 8139

原创 Overleaf小工具和报错解决方法积累

在线公式编辑工具:【1】【2】【3】【4】【5】

2023-07-18 23:50:09 1999

原创 小作文--流程图(练习1)

流程图(Flow chart/ Process diagram)传统意义上来说,流程图是两种主要类型,一是关于动物的生命周期,二是关于制造产品的工艺流程。但是近年来的话,也出现了非传统意义上的工艺流程,它并不是关于制造某个产品的过程,而是审批流程。

2023-06-07 22:51:07 1199 1

原创 预训练模型 ---- BERT架构

BERT是2018年10月由Google AI研究院提出的一种预训练模型。BERT的全称是Bidirectional Encoder Representation from Transformers。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出SOTA表现。包括将GLUE基准推高至80.4%(绝对改进7.6%),MultiNLI准确度达到86.7%(绝对改进5.6%),成为NLP发展史上的里程碑式的模型成就。

2023-05-25 17:19:44 3232 3

原创 多肽数据库

多肽数据库记录

2023-02-08 16:47:58 1551

原创 PDB文件格式说明查看方式记录

对于研究蛋白质性质的课题,都需要明确知道物质结构信息而非简单的序列信息。

2023-02-02 11:07:13 911

转载 模型的第一层:详解torch.nn.Embedding和torch.nn.Linear

torch.nn.Embedding是用来将一个数字变成一个指定维度的向量的,比如数字1变成一个128维的向量,数字2变成另外一个128维的向量。不过,这128维的向量并不是永恒不变的,这些128维的向量是模型真正的输入(也就是模型的第1层)(数字1和2并不是,可以算作模型第0层),然后这128维的向量会参与模型训练并且得到更新,从而数字1会有一个更好的128维向量的表示。显然,这非常像全连接层,所以很多人说,Embedding层是全连接层的特例。

2023-01-30 11:47:55 1344

原创 安装Anaconda和在Jupyter notebook中切换内核遇到的问题

jupyter notebook里面切换内核遇到的关于ipython.core找不到模块和内核不能连接的问题

2022-08-18 16:39:16 2089

原创 用Networkx和matplotlib画图时无法保存图片的问题

问题:用 NetworkX 和 matplotlib画图时,想要保存为jpg或png格式的文件,结果发现保存的图片没有任何内容,只是一个白色的图像。

2022-06-23 22:20:32 1627

原创 RDKit学习

@Time : 2022/5/25 17:39@Author : Qiufen.Chen@FileName: learn_rdkit.py@Software: PyCharm'''from rdkit import Chemfrom rdkit.Chem import Draw, Descriptors, Crippen, MolSurf, Lipinskifrom rdkit.Chem.Crippen import MolLogP, MolMRfrom rdkit.Chem.Draw .

2022-05-31 22:32:50 1421

原创 回归问题归一化总结

在用深度学习做回归问题时,对数据进行标准化处理是一个共识,将数据标准化,利用标准化后得数据进行数据分析。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。那么对标签是否进行归一化就需要从实际问题出发,比如我在做药物分子溶解度预测时,溶解度的取值从0-5000,值的分布范围较大,这就需要进行归一化处理,因为我这个数据中出现了奇异

2022-05-25 15:54:38 5807 2

原创 python创建文件夹

函数形式def mkdir(path): isExists = os.path.exists(path) if not isExists: os.makedirs(path) print('Directory create successfully!') return True else: print('Directory already exists!') return Falsesave_d

2022-04-22 11:21:48 987

原创 python将下三角矩阵补全成对称矩阵

# Author QFIUNE# coding=utf-8# @Time: 2022/4/18 12:25# @File: 222.py# @Software: PyCharm# @contact: 1760812842@qq.comimport numpydef square_mat_in_trilu_indices(n): '''Return a n x n symmetric index matrix, in which the elements are the i.

2022-04-22 09:58:54 1223

原创 python修改图片尺寸和DPI

使用PIL库pip3 install pillow'''# !/usr/bin/python3# -*- coding: utf-8 -*-@Time : 2022/4/21 17:16@Author : Qiufen.Chen@FileName: 111.py@Software: PyCharm'''from PIL import Imagedef Image_PreProcessing(): # 待处理图片存储路径 im = Image.open('C:/User

2022-04-21 17:25:56 4071

原创 MemBrain2.0_论文

MemBrain-contact 2.0: a new two-stage machine learning model for the prediction enhancement of transmembrane protein residue contacts in the full chainMemBrain-contact 2.0:一种新的两阶段机器学习模型,用于预测全链跨膜蛋白残基接触的增强AbstractMotivationInter-residue contacts in p

2022-04-17 20:18:46 8823

原创 学习RDKit

最近要做一个药物分子属性预测的课题,在跑别人现成的模型时,出现了花两天时间都解决不了的Bug。这让我开始反思,无脑套用网上的模型真的好吗?之前对“一知半解”嗤之以鼻,觉得自己怎么样都不会成为那个对知识对学问敷衍的人。可是为了赶进度,自己慢慢的也变成了一个知其然而不知其所以然的人了。无意中读到蔡元培先生的北大就职演说里上说的话:平时则放荡冶游,考试则熟读讲义,不问学问之有无,惟争分数之多寡;试验既终,书籍束之高阁,毫不过问,敷衍三四年,潦草塞责,文凭到手,即可借此活动于社会,岂非与求学初衷大相背驰乎?

2022-04-15 19:30:45 3147 2

原创 stochastic masks——随机掩码

阅读不能停,保持日常输入大于输出【通过学习随机掩码来解释生物序列的神经网络】切入正题之前,去了解了一下“掩码”的概念。参考:浅析深度学习中的mask操作_guofei_fly的博客-优快云博客_深度学习mask参考:图像中的掩膜(Mask)是什么_bitcarmanlee的博客-优快云博客_掩膜mask(掩码、掩膜)是深度学习中的常见操作。简单而言,其相当于在原始张量上盖上一层掩膜,从而屏蔽或选择一些特定元素,因此常用于构建张量的过滤器。按照上述定义,非线性激活函数Rel

2022-04-08 21:25:08 4419

原创 图的基本知识

一、图的背景来源:知乎------图解:什么是“图”? - 知乎图论的起源是基于一个现实生活中的事例:河中心有两个小岛。小岛与河的两岸有七条桥连接。在所有桥都只能走一遍的前提下,如何才能把这个地方所有的桥都走遍?欧拉在1735年提出,并没有方法能圆满解决这个问题,他更在第二年发表在论文《柯尼斯堡的七桥》中,证明符合条件的走法并不存在。欧拉把实际的抽象问题简化为平面上的点与线组合,每一座桥视为一条线,桥所连接的地区视为点。这样若从某点出发后最后再回到这点,则这一点的线数必须是偶

2022-01-12 16:27:23 1729

BP神经网络算法实现

自己用MATLAB写的BP神经网络代码,改一下数据能运行成功,每一行都有注释!

2018-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除