
生信论文
文章平均质量分 93
汇集生物信息论文笔记
wangpan007
世间不会怜悯弱者,只会敬畏强者
展开
-
论文解读:ProteinBERT: a universal deep-learning model of protein sequence and function
目录1. 研究背景2. 研究数据2.1 预训练的蛋白质数据集2.2 蛋白质基准数据集3. 研究方法3.1 序列和标注编码3.2 蛋白质序列和注释的自我监督预训练3.3 对蛋白质基准进行监督微调3.4 深度学习框架4. 结果4.1 预训练可以改善蛋白质模型4.2 ProteinBERT在不同的蛋白质基准上达到了近乎最先进的结果4.4 全局注意力机制的理解5. 结论作者单位:耶路撒冷希伯来大学发表期刊:《Bioinformatics》,2020年期刊影响因子:6.937发表时间:2022年1月9日数据和原创 2022-03-03 19:21:19 · 8892 阅读 · 4 评论 -
论文解读:学习蛋白质的空间结构可以提高蛋白质相互作用的预测
文章目录论文概况1. 研究背景2. 研究数据2.1 种内数据集2.2 种间数据集2.3 多类别数据集3. 研究方法3.1数据预处理3.2局部特征提取3.3 结构特征提取3.3.1 构建预测接触图3.3.2 图表示学习3.4 预测模块4. 结果4.1 种内数据集上的性能比较4.1.1四个种内数据集性能比较4.1.2与其他算法比较4.2 多物种数据集的性能比较4.2.1 不同阈值的序列同一性比较4.2.2 TAGPPI与PIPR方法比较4.3 多类别数据集性能比较4.4 消融实验4.4.1TextCNN和图注意原创 2022-01-15 18:36:37 · 3468 阅读 · 6 评论 -
论文解读:基于BERT和二维卷积神经网络的迁移结构,从序列信息中识别DNA增强子
文章目录论文基本情况1. 研究背景2. 实验数据3. 实验方法3.1 数据预处理3.2 BERT算法应用论文基本情况作者单位:台湾省台北医科大学发表期刊:《Briefings in Bioinformatics》,2020年期刊影响因子:11.622数据和代码:https://github.com/khanhlee/bert-enhancer1. 研究背景生物背景:增强子是DNA上一小段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游。算法背原创 2021-10-31 20:38:40 · 1357 阅读 · 0 评论 -
论文解读:BERT-Kcr: Prediction of lysine crotonylation sites by a transfer learning method
目录论文基本情况1. 研究背景2. 研究进展3. 实验数据3.1 赖氨酸巴豆酰化数据集3.2 赖氨酸糖化和乙酰化数据集4. 实验方法4.1 BERT特征编码4.2 分类器模型5. 研究结果5.1滑动窗口大小的选择5.2 不同BERT预训练模型比较5.3 不同NLP模型比较5.4 BERT模型的优化论文基本情况作者单位:清华大学生命科学学院、安徽农业大学。发表期刊情况:《Bioinformatics》,2020年影响因子:6.937。代码链接: http://zhulab.org.cn/BERT-Kc原创 2021-10-29 10:52:33 · 1554 阅读 · 0 评论 -
论文解读:An Interpretable Prediction Model for Identifying N7-Methylguanosine Sites Based on XGBoost
目录论文简介1. 背景2. 数据3. 方法3.1 概述3.3 特征编码方法3.3.1 Binary Encoding3.3.2 CKSNAP3.3.3 ENAC3.3.4 NCP3.3.5 ND3.3.6 SCPseDNC3.4 XGBoost算法3.5 SHAP算法4 结果4.1 与其他现今算法比较4.1.1 交叉验证4.1.2 T检验4.2 特征编码对模型预测的影响4.2.1 最好的20个特征的影响4.2.2 去除这最好20个特征后的影响4.3 特征选择评价指标的影响4.4 与iRNA-m7G比较5 结原创 2021-10-03 19:13:47 · 775 阅读 · 0 评论 -
论文解读:Attention-based convolutional neural networks for protein-protein interaction site prediction
文章目录论文简介1. 背景2. 数据2.1 输入的特征3. 方法4. 结果论文简介作者单位:郑州大学论文状态:在bioRxiv发布了预印本1. 背景从蛋白质序列中准确预测蛋白质-蛋白质相互作用位点(PPIs)有助于我们对蛋白质-蛋白质相互作用的理解,有助于蛋白质-蛋白质对接,对药物设计至关重要。2. 数据我们使用了与最先进的方法DeepPPISP相同的蛋白质序列,包括三个基准数据集Dset_186、Dset_72和Dset_164,如下表所示:2.1 输入的特征3. 方法4. 结果原创 2021-09-15 13:00:11 · 1047 阅读 · 0 评论 -
论文解读:DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences
DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences论文导读1. 论文基本信息2. 生物背景2.1 研究问题3. 实验数据4. 实验方法4.1 模型4.2 A-DNA、B-DNA和ssDNA相互作用指标5. 结果5.1 对A-DNA,B-DNA和SSDNA结合残基预测的比较评估5.2 分析和评价交叉预测5.3 RNA结合蛋白交叉预测的评估5.4 dsDNA和ssDNA结合蛋白预测的比较原创 2021-09-12 18:36:23 · 482 阅读 · 1 评论 -
论文解读:A novel antibacterial peptide recognition algorithm based on BERT
A novel antibacterial peptide recognition algorithm based on BERT论文概述1. 论文基本信息2. 生物背景2.1 肽的理解2.2 抗菌肽的理解2.3 论文解决的问题3. 实验数据3.1 引用的数据集3.2 作者自己处理的数据集4. 方法4.1 数据预处理4.2 预训练4.3 微调4.4 预测5. 结果5.1 对比其他方法独立测试结果5.2. 预训练对实验结果的影响5.3 平衡数据对微调模型的影响5.4 训练得到一个通用模型6. 结论论文概述原创 2021-08-15 19:15:33 · 1053 阅读 · 0 评论 -
BERT代码解读
文章目录本文框架1. BERT定义2. BERT实现2.1 BERT输入2.1.1 Token Embeddings(input_ids)2.1.2. Segment Embeddings(token_type_ids)2.1.3 Position Embeddings(attention_mask)2.2 预训练2.2.1 获取序列的embeddings2.2.2 利用Transformer对序列进行编码3.我的做法4. 结果5. 下一步打算本文框架1. BERT定义BERT全称Bidirecti原创 2021-08-01 18:43:08 · 5791 阅读 · 2 评论 -
LBERT: Lexically aware Transformer-based Bidirectional Encoder Representation model for learning
目录论文简介摘要:1. 介绍2. 数据3. 方法3.1 LBET模型3.1.1 LBET的发展背景3.1.2 BERT算法理解3.1.3 词汇模式表示法3.1.4 距离引导注意机制论文简介作者单位:台湾省阳明大学生物信息研究所论文地址:链接代码地址:链接期刊分区及影响因子:摘要:饿到一个通用的自然语言处理的技术(LBET)来解决生物实体关系提取(BRE)。概念理解:LBET:基于词汇感知变压器的双向编码器表示,带有词法嵌入和距离注意力机制的BERT算法。BRE:生物实体关系提取是一原创 2021-07-04 19:27:28 · 807 阅读 · 0 评论 -
论文解读:Prediction of Protein–Protein Interaction Sites Using Convolutional Neural Network
目录论文简介摘要相互作用残基对的定义数据集论文简介论文代码: https://github.com/Xiaoya-Deng/PPI-sites-prediction论文原文:https://www.mdpi.com/1422-0067/21/2/467补充材料: http://www.mdpi.com/1422-0067/21/2/467/s1作者单位:重庆邮电大学期刊影响因子:4.556(中科院二区)摘要提出一种卷积神经网络用于PPI站点预测,并利用残基结合倾向来改善阳性样本。该方法在改进原创 2021-06-06 15:37:49 · 1305 阅读 · 0 评论 -
论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning
文章目录论文概况摘要1 介绍2 方法2.1 特征表示2.1.1 蛋白质的图表示2.2 EGAT的结构2.2.2 边缘聚合图关注层2.2.3 预测概率2.2.4 EGAT结构图2.3 EGAT端到端的结构2.4 GAT-PPI:基于GAT的没有边聚合PPI预测3 结果和讨论3.1 数据3.2 结果3.2.1 与其他先进方法独立测试比较3.3 长期相互作用对PPI站点预测的影响3.4 基于 ProtBERT特征的迁移学习的影响3.5 边的可解释性和注意力得分4 总结论文概况原文链接:https://w原创 2021-04-24 20:24:46 · 4875 阅读 · 1 评论 -
利用XGBoost特征选择和堆叠集成分类器提高蛋白质-蛋白质相互作用预测精度
文章目录论文基本情况一、论文创新点:二、方法(一)、特征提取方法(二)、XGBoost特征选择(三)、叠迭分类器:三、数据四、实验结果(一)参数的确定(m=9)(二)、基分类器确定,元分类器比较论文基本情况期刊:《Computers in Biology and Medicine》影响因子及中科院分区:IF: 3.434,中科院三区发表日期:2020年7月作者单位:青岛科技大学代码地址: https://github.com/QUST-AIBBDRC/StackPPI/原文链接:https:原创 2021-03-31 19:13:26 · 1731 阅读 · 0 评论 -
论文笔记:DeepEP: a deep learning framework for identifying essential proteins
论文笔记:DeepEP: a deep learning framework for identifying essential proteins一、论文创新二、方法(一)、网络结构(二)、Node2vec得到拓扑特征(三)、采样方法三、数据四、结果一、论文创新1.通过得到了得到了蛋白质的拓扑特征。2.采用了一种采样方法有效的解决了重要蛋白质和不重要蛋白质的失衡问题。二、方法(一)、网络结构提出了一种新的深度学习架构,DeeEP1.网络有两部分组成:特征提取和分类2.PPI网络的蛋白质拓原创 2021-03-07 19:09:57 · 922 阅读 · 3 评论 -
论文:Developing Computational Model to Predict Protein-Protein Interaction Sites Based on the XGBoost
文章目录简介一、论文创新点二、介绍三、结果(一)、两种平衡模式下的预测性能(二)、不平衡和平衡数据集的比较四、讨论(一)、与其他方法比较(二)、独立基准数据集的预测性能(三)、实验结果可视化(四)、预测验证的极限简介发表期刊:《International Journal of Molecular Sciences》(生物二区,期刊2019年影响因子:4.556)论文网址:https://www.mdpi.com/1422-0067/21/7/2274论文作者学校:安徽科技大学一、论文创新点提出了原创 2021-01-30 00:17:22 · 592 阅读 · 0 评论 -
论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein In
文章目录一、摘要二、方法(一)、蛋白质图的表示(二)、节点级特征表示(三)、边级特征表示(四)、 EGAT结构的主要特点(五)、边缘聚合图关注层(六)、在计算注意力分数时使用边缘特征三、结果(一)、数据集(二)、基准数据集上的结果(三)使用基于 ProtBERT的特性进行迁移学习的影响四、总结一、摘要图神经网络(GNN)已成为结构信息编码的一种有效工具,尽管基于GNN的体系结构已被应用于配对结合位点预测,但他没有被用来预测单个蛋白质的结合位点。此外,与可能不适当编码远程相互作用的残基特异性信息的方法不同原创 2021-01-20 19:01:15 · 3216 阅读 · 0 评论 -
论文笔记:Protein-protein interaction site prediction through combining local and global features
文章目录一、论文基本情况二、前言三、数据(一)训练集和测试集(二)特征四、方法(一)局部特征(二)全局特征(三)文本卷积神经网络(TextCNN)五、模型的应用域(AD)(二)、全局特征的重要性(三)预测准确的情况(四)不同长度蛋白质的影响七、总结一、论文基本情况发表期刊:Bioinformatics(最新的IF=5.61)作者及单位:中南大学李敏团队服务器地址:http://bioinformatics.csu.edu.cn/PPISP/代码及数据地址:https://github.com/C原创 2021-01-03 19:52:50 · 3038 阅读 · 6 评论 -
论文笔记:DELPHI:预测蛋白质相互作用位点的精确深度集成模型
文章目录摘要:一、介绍二、材料和方法(一)、数据库(二)、测试集(三)、训练集和验证集(四)、输入特征(五)、模型架构(六)、CNN模型架构Web服务器:www.csd.uwo.ca/~yli922/index.php特征计算流水线:github.com/lucian-ilie/DELPHI联系邮箱: ilie@uwo.ca补充资料:摘要:动机:蛋白质通常通过与其他蛋白质相互作用来发挥功能,这就是为什么准确预测蛋白质-蛋白质相互作用(PPI)结合位点是一个基本问题。实验方法既缓慢又昂贵。因此,人原创 2020-11-07 21:11:10 · 6223 阅读 · 1 评论 -
论文笔记:m6Acorr: an online tool for the correction and comparison of m6A methylation profiles
文章目录前言必备生物知识一、论文创新点二、背景前言论文发表期刊:《BMC BIOINFORMATICS》期刊影响因子:3.242期刊中科院分区:生物 3 区m6Acorr服务器: http://www.rnanut.net/m6Acorr校正函数及数据网址: https://github.com/emersON106/m6Acorr补充材料网址: https://doi.org/10.1186/s12859-020-3380-6作者简介:李建伟来自河北科技大学,黄燕来自北京大学必备生物知识原创 2020-10-14 11:16:48 · 849 阅读 · 0 评论