
生物信息学
文章平均质量分 92
Super齐
纯种理工女,在读研究生。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Phosformer:蛋白激酶特异性磷酸化预测的一个可解释的transformer模型
人类基因组编码超过500种不同的蛋白激酶,它们通过蛋白质底物的特定磷酸化来调节几乎所有的细胞过程。虽然质谱和蛋白质组学研究的进展已经确定了跨物种的数千个磷酸化位点,但对于绝大多数磷酸化位点,目前缺乏关于磷酸化这些位点的特定激酶的信息。最近,预测激酶-底物关联的计算模型的发展得到了广泛的关注。然而,目前的模型只允许对研究充分的激酶子集进行预测。此外,在训练和测试数据集中利用手工处理的特征和不平衡,对开发激酶特异性磷酸化预测的准确预测模型提出了独特的挑战。翻译 2023-02-16 14:09:08 · 1784 阅读 · 0 评论 -
A transformer-based model to predict peptide– HLA class I binding and optimize mutated peptides for
文章链接:https://www.nature.com/articles/s42256-022-00459-7.pdfDOI:10.1038/s42256-022-00459-7期刊:Nature Machine Intelligence(一区)发布时间:2022年3月23日数据和代码:https://github.com/a96123155/TransPHLA-AOMPTransMut网站:https://issubmission.sjtu.edu.cn/TransPHLA-AOMP/inde.原创 2022-04-22 15:27:42 · 1092 阅读 · 0 评论 -
生物学家掌握机器学习指南
(在生信菜鸟团这个公众号上看到的,自己在这里做一个总结,仅为自己学习方便)参考文章:A guide to machine learning for biologistshttps://doi.org/10.1038/s41580-021-00407-0作为生物学家,如何进行机器学习的学习对生物数据建模的最大挑战是数据种类繁多。生物学家使用的数据包括基因和蛋白质序列、随时间推移的基因表达水平、进化树、显微镜图像、3D 结构和相互作用网络等。研究者在下图中,总结了针对特定生物数据类型的一些例子和重要注原创 2022-04-13 14:46:04 · 609 阅读 · 0 评论 -
iRice-MS:一种检测水稻多型翻译后修饰位点的集成XGBoost模型
文章链接:https://doi.org/10.1093/bib/bbab486DOI:10.1093/bib/bbab486期刊:BiB发布时间:2022 年 1 月 173日数据集:http://lin-group.cn/server/iRice-MS/download.html文章目录前言一、简介二、材料和方法2.1 基准数据集构建2.2 特征编码方案2.2.1 第1组:基于序列的特性(1)Position weight amino acid (PWAA) composition.(2.原创 2022-03-10 17:10:24 · 643 阅读 · 1 评论 -
GPS-Uber:一个用于预测一般和e3特异性赖氨酸泛素化位点的混合学习框架
文章链接:https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbab574/6509047DOI:10.1093/bib/bbab574/6509047期刊:BiB发布时间:2022 年 1 月 17 日初始基准数据集、二次训练数据集和独立测试数据集均可在:http://gpsuber.biocuckoo.cn/userguide.php上免费下载。文章目录前言一、简介二、方法2.1 数据收集和准备2.2原创 2022-03-07 20:48:48 · 6139 阅读 · 0 评论 -
NmRF:从RNA序列中鉴定多物种RNA2‘-o-甲基化修饰位点(假尿苷位点)
文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matpl原创 2022-03-01 17:26:37 · 3192 阅读 · 1 评论 -
scMRA:一种健壮的深度学习方法,可以用多个参考数据集注释scRNA-seq数据
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言动机:单细胞RNA-seq (scRNA-seq)已被广泛用于解决细胞异质性。收集完scRNA-seq数据后,下一步自然是集成积累的数据,以实现细胞类型和状态的公共本体。因此,迫切需要一种有效、高效的细胞型识别方法。同时,高质量的参考数据仍然是精确标注的必要条件。但在实践中,这种有针对性的参考数据一直缺乏。为了解决这个问题,我们将多个数据集聚合到一个元数据集原创 2022-02-22 21:15:06 · 2261 阅读 · 0 评论 -
cfDNA的5-羟甲基胞嘧啶谱高度预测弥漫大B细胞淋巴瘤患者的R-CHOP治疗反应
文章链接:https://link.springer.com/article/10.1186/s13148-020-00973-8#availability-of-data-and-materialsDOI:https://doi.org/10.1186/s13148-020-00973-8期刊:Clinical Epigenetics(医学2区)发布时间:2021年2月11日补充文件: https://doi.org/10.1186/s1314 8‑020‑00973 ‑8.文章目录1. 文章原创 2022-01-26 18:19:15 · 1357 阅读 · 0 评论 -
利用负样本空间改进细胞因子-受体相互作用预测
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、二、使用步骤1.引入库2.读入数据总结前言背景:细胞因子通过与靶细胞质膜上的特定受体结合而起作用。细胞因子-受体相互作用(CRI)的知识对于理解各种人类疾病的发病机制(尤其是自身免疫、炎症和感染性疾病)和确定潜在的治疗靶点非常重要。近年来,机器学习算法被用于CRIs预测。目前还缺乏“黄金标准”的负数据集,负数据集的强烈偏差会显著影响学习算法的训练和评价。为了减轻负样本选择(非相互作用蛋白)固有的不代表性和偏差,我们提出原创 2021-11-27 11:10:01 · 1566 阅读 · 1 评论 -
生物网络中基于节点相似度的链路预测图卷积
生物网络中基于节点相似度的链路预测图卷积前言一、介绍二、材料和方法三、结果与讨论四、结论文章地址:https://https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab464/6307262?redirectedFrom=fulltextDOI:10.1093/bioinformatics/btab464期刊:Bioinformatics(2区)发布时间:202原创 2021-10-05 20:07:44 · 2377 阅读 · 0 评论 -
2021-09-02
DeepT orrent: a deep learning-based approachfor predicting DNA N4-methylcytosine sites前言一、前言一、介绍2.读入数据总结for predicting DNA N4-methylcytosine sites)前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例原创 2021-09-12 12:17:35 · 996 阅读 · 0 评论 -
2021-08-13
@[TOC](m6AmPred:基于序列衍生信息识别RNA N6,2′-O-二甲基腺苷(m6Am)位点)分区:2区IF:3.864数据:代码:网站:https://www.xjtlu.edu.cn/biologicalsciences/m6am提示:以下是本篇文章正文内容,下面案例可供参考前言N6,2′-O-二甲基腺苷(m6Am)是一种广泛存在于各种RNA分子上的可逆修饰。m6Am的生物学功能尚不清楚,尽管最近的研究揭示了它对细胞基因命运的影响。精确识别核糖核酸上的m6Am位点对于理解原创 2021-08-21 17:29:43 · 688 阅读 · 0 评论 -
2021-07-26
论文解读:基于注意力的多标签神经网络,用于集成预测和解释12种广泛发生的RNA修饰前言一、pandas是什么?二、结果1.MultiRM框架2.多重性能3.解释4.MultiRM网络服务器讨论方法1.原始数据和预处理2.Embeddings2.模型设计2.评估指标3.统计显著性4.解释5.基线性能6.基于注意力的DNN(脱氧核糖核酸)前言最近的研究表明,通过转录后核糖核酸修饰的表转录组调节对所有类型的核糖核酸都至关重要。精确鉴定核糖核酸修饰位点对于理解核糖核酸的功能和调节机制至关重要。在这里,我们介绍了原创 2021-07-26 21:05:31 · 1018 阅读 · 0 评论 -
2021-06-13
论文解读:《基于图形卷积网络,通过特征图和拓扑图进行图形采样,识别微小核糖核酸相关疾病》一、摘要二、简介三、相关工作四、材料和方法五、节点特征构造六、方法七、结果和讨论八、案例研究九、结论文章地址:https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbab165/6261915?redirectedFrom=fulltextDOI:https://doi.org/10.1093/bib/bbab165期刊:Br原创 2021-06-15 20:18:27 · 2537 阅读 · 0 评论 -
论文解读:《自增强GNN:利用模型输出改进图神经网络》
DOI:https://arxiv.org/abs/2002.07518期刊:MACHION LEARNING(3区)影响因子:2.445发布时间:2021年4月19日代码:https://github.com/yang-han/Self-Enhanced_GNN摘要图神经网络因其在基于图的任务中的优异性能而受到广泛关注。然而,现有的关于神经网络的研究主要集中在设计更有效的模型上,而没有过多考虑输入数据的质量。在本文中,作者提出了自增强GNN (SEG),它利用现有GNN模型的输出来提高输入数原创 2021-05-28 22:01:05 · 1333 阅读 · 0 评论