自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 CLEAN(Enzyme function prediction using contrastive learning2023)

摘要酶功能注释是一个基础性挑战,已经开发了众多的计算工具。然而,大多数这些工具无法准确预测研究较少的蛋白质或先前功能未表征或具有多重活性的蛋白质的功能注释,例如酶学委员会(EC)编号。我们提出了一种名为 GLEAN(基于对比学习的酶注释)的机器学习算法,与最先进的工具 BLASTp 相比,能够以更好的准确性、可靠性和灵敏度将 EC 编号分配给酶。对比学习框架使 GLEAN 能够自信地(i)注释未被描述的酶,(ii)纠正错误标记的酶,以及(iii)识别具有两个或更多 EC 编号的混杂酶——我们通过系统的计算机

2025-11-05 16:59:21 586

原创 DEEPEC论文

摘要高质量和高通量的酶委员会编号(EC号)预测对于准确理解酶的功能至关重要,这在病理学研究和工业生物技术中都有广泛应用。目前已有若干EC号预测工具被提出,但其预测性能仍需进一步提升,以便更加精确、高效地处理不断增长的蛋白质序列数据量。在此,我们提出了 DeepEC,一个基于深度学习的计算框架,能够以高精度和高通量的方式预测蛋白质序列的EC号。DeepEC以蛋白质序列作为输入,输出对应的EC号。该框架采用三个卷积神经网络(CNN)作为主要预测引擎,同时结合同源性分析来处理那些CNN无法分类的EC号。与五种代表

2025-11-05 15:25:13 492

原创 TransGNN(2023年)

在 Transformer 的帮助下,GNN 的接受场可以扩展到更多相关的节点,这些节点可能远离中心节点。给定输入图 G 及其相似度矩阵 S,对于图中的节点 𝑣𝑖,我们将其注意力样本定义为集合 Smp(𝑣𝑖) = {𝑣𝑗 |𝑣𝑗 ∈ 𝑉 和 𝑆(𝑖, 𝑗) ∈ top-k (𝑆(𝑖, :))} 其中𝑆(𝑖, :) 表示 S 的第 𝑖 行,𝑘 作为超参数,决定应该关注多少个节点。在图数据中,不需要计算每个节点对整个图的关注,只要考虑最相关的节点就足够了,这不仅降低了复杂性,

2025-09-15 20:37:52 795

原创 GTC: GNN-Transformer Co-contrastive Learning for Self-supervised Heterogeneous Graph Representatio

摘要图神经网络(GNN)凭借消息传递机制强大的局部信息聚合能力,已成为处理各类图任务的最有力工具。然而,过度平滑问题一直阻碍着GNN向更深层发展及捕获多跳邻居信息的能力。与GNN不同,Transformer可通过多头自注意力机制建模全局信息和多跳交互,且适当的Transformer结构对过度平滑问题具有更强的免疫力。那么,能否提出一种新颖框架来融合GNN与Transformer,同时整合GNN的局部信息聚合能力与Transformer的全局信息建模能力,从而消除过度平滑问题?为实现这一目标,本文提出了GNN

2025-09-14 09:18:16 923

原创 TAWFN:一种用于蛋白质功能预测的深度学习框架

TAWFN的结构如图1所示,主要包括四个模块:输入数据生成模块、自适应GCN模块、多层卷积神经网络模块和自适应融合模块。我们使用输入数据生成模块构建输入,然后通过AGCN和MCNN训练输入,最后通过自适应融合网络融合两者的结果。图1. TAWFN模型架构图。该模型包含四个模块:(a) 输入数据生成模块:该模块生成蛋白质接触图及序列编码特征,包括ESM-1b编码和独热编码;

2025-07-07 14:47:59 1137

原创 如何部署ProtDETR环境,如何解决错误,并成功运行

其他安装包可以先尝试运行一个代码,错误提示会告诉我们缺少什么包,根据错误提示去下载就行,我展示一下我安装的所有包,这些包不用一个一个的下载,很多都是连带下载的。在首次运行代码时会自动下载esm模型,该模型有7.3GB,需要很久,耐心等待,或者直接参考4中的错误提示II,手动下载。暂时我就遇到这两个错误,有其他错误解决不了的可以发在评论区一起分析一下。将这两个文件上传到服务器,可以创建一个名为esm的文件夹,将二者放入。由于我们下载了作者提供的训练好的模型,所以不用再训练了。修改代码:将main函数中的。

2025-06-11 17:28:04 1031

原创 DERT论文

因为用的是自回归的方法,第2层的输出是第3层的输入。100个object query是有100个向量,这100个向量和通过encoder提取的特征输入Decoder,这100个向量相当于查询,这个框是鸭子吗?object query要先进行self-Attention,可以这样理解,这100个查询先开个会,明确自己要关注的地方,比如这个框是鸭子吗?object query :encoder输出的特征就是K V ,每对分别代表图中一个框的位置,这100个查询并行去问这些K V,我应该关注你吗?

2025-06-08 15:05:35 355

原创 论文Interpretable Enzyme Function Prediction via Residue-Level Detection(ProtDETR)

从酶序列中预测带有酶学委员会编号(EC编号)的多种功能具有重要意义,但由于其稀疏的多标签分类特性(即每种酶通常仅与6000多种可能的EC编号中的少数标签相关联),这一任务仍面临挑战。现有机器学习算法通常为每种酶学习固定的全局表征来预测所有功能,因而缺乏可解释性,且可能掩盖某些功能特异性局部残基片段的关键信息。本研究提出一种基于注意力机制的框架ProtDETR(蛋白质检测变换器),将酶功能预测转化为检测问题。该框架通过一组可学习的功能查询,自适应地从残基级特征序列中提取不同局部表征以预测不同EC编号。

2025-05-28 20:25:43 1247

原创 (避坑)linux服务器下载neo4j,并且用自己电脑如何访问(远程计算机访问)

首先告诉大家一个小妙招,在此过程中不管遇到什么难题,都可以问gpt,国内的可以用千问,kimi,百川等等。我用的deepseek简直不要太好用!!!

2024-12-19 14:00:00 2363 3

原创 微软Graphrag+ollama实现本地部署 使用qwen2.5模型

为什么不直接跑微软的Graphrag源码,而要ollama部署到本地呢?答案也是非常简单,直接跑这个项目的话,需要openai的apikey,花tokens,很烧money!!!而通过ollama部署到本地,就可以轻松免费玩Graphrag。

2024-12-18 19:29:22 2511 1

原创 (超详细教程)没有sudo权限,在服务器安装ollama,下载qwen2模型,python代码测试

本文详细介绍了ollama的下载安装,如何在命令行下载,如何在本地下载上传服务器。以及环境变量的部署,以及如何拉取模型,python代码测试,都有详细的介绍。

2024-12-15 14:19:38 6690 10

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除