- 博客(1435)
- 收藏
- 关注
原创 蛋白质设计软件LigandMPNN介绍
LigandMPNN 是一种用于蛋白质设计(protein design)的深度学习模型,基于 ProteinMPNN 的架构扩展而来,专为配体结合蛋白质(ligand-binding proteins)设计而优化。它是 2023 年由 David Baker 团队(华盛顿大学蛋白质设计研究所,IPD)发布的,旨在设计与小分子、肽或其他配体相互作用的蛋白质序列。
2025-06-03 21:14:52
315
原创 蛋白质结构预测软件openfold介绍
openfold 是一个用 Python 和 PyTorch 实现的 AlphaFold2 的开源复现版,旨在提升蛋白质结构预测的可复现性、可扩展性以及研究友好性。它允许研究者在不开源 DeepMind 原始代码的情况下,自由地进行蛋白结构预测的训练和推理,并支持自定义模型改进。
2025-06-03 20:20:56
336
原创 分子进化分析软件MEGA介绍
MEGA(Molecular Evolutionary Genetics Analysis) 是一款用于分析分子序列(DNA、RNA、蛋白质)的软件
2025-06-03 19:59:38
565
原创 dali搜索结果筛选
Python 脚本示例,它将从 DALI 比对输出txt文件中自动筛选同源结构,特别是远源同源,并以表格形式输出符合条件的比对项。
2025-05-22 10:25:16
201
原创 dali本地安装和使用
Dali(Distance-matrix ALIgnment)是一种广泛使用的蛋白质结构比对工具,主要用于比较蛋白质三维结构之间的相似性。它通过计算蛋白质结构之间的距离矩阵来评估结构之间的相似性,并生成比对结果。
2025-05-21 20:28:15
290
原创 ChimeraX介绍
UCSF ChimeraX 是一款由美国加州大学旧金山分校(UCSF)开发的下一代分子可视化软件,是经典的 UCSF Chimera 的继任者。它集成了强大的分子结构可视化、分析、建模和动画功能,广泛应用于结构生物学、药物设计、分子建模等领域。
2025-05-20 16:52:08
911
原创 PyMOL命令行和脚本
PyMOL 的命令行(也就是 PyMOL 命令)既能够在 Python 脚本里运用,也可以在 PyMOL 软件自身的命令输入框(PyMOL>)中直接输入。二者在具体使用时存在一些细微差别。
2025-05-19 20:55:25
479
原创 PyMOL结构对齐方式
在 PyMOL 中,对齐(Alignment)是一项核心功能,主要用于比较和叠加不同的分子结构。这对于研究蛋白质的构象变化、序列同源性以及进行结构比对非常重要。
2025-05-19 20:48:34
672
原创 Foldseek结构搜索结果筛选
Foldseek 同源结构搜索默认输出字段有:query、target、fident、alnlen、mismatch、gapopen、qstart、qend、tstart、tend、evaluate、bits,但可以用--format-output 输出选项进行自定义,例如--format-output“query、target,qaln,taln”以制表符分隔的格式返回查询和目标加入以及成对对齐。
2025-05-19 10:35:00
183
原创 UniRef100 ID 转换 UniProtKB ID
UniProtKBID是UniProt数据库中蛋白质条目的唯一标识符,分为Swiss-Prot和TrEMBL两个分支。AlphaFold预测结构基于UniProtKB的AccessionID生成。UniRef100是UniProt Reference Clusters数据库的一个层级,将100%序列相同的蛋白质聚类成一个单元,每个聚类有一个代表序列,通常来自UniProtKB。UniRef100ID代表整个完全一致的序列簇,而不是单个蛋白。要从UniRef100ID获取代表的UniProtKBID,可以通过
2025-05-18 18:08:14
627
原创 Foldseek本地安装和使用
FoldSeek 是一种极快的蛋白质结构搜索工具,支持多种输入格式(PDB/mmCIF/AlphaFold-predicted structures),在本地运行效果极佳。
2025-05-18 10:52:28
226
原创 Foldseek在线蛋白质结构搜索
Foldseek 是由韩国首尔大学 Martin Steinegger 团队开发的蛋白质结构相似性搜索工具,其核心技术基于 3Di(三维相互作用字母表) 和 MMseqs2 框架,实现了速度与灵敏度的突破。
2025-05-18 09:02:30
903
原创 ESMFold在线预测蛋白质结构
ESMFold 是由 Meta AI(前 Facebook AI)开发的一种 基于语言模型的蛋白质结构预测工具,它比 AlphaFold 更快,能够在几秒至几分钟内预测中小型蛋白质的三维结构。
2025-05-18 08:33:44
422
原创 TrimAl介绍
TrimAl (trim alignment)是一个用于从多序列比对MSA结果中自动去除质量差的区域(gap 多、保守性低),保留可靠的同源区域,提高进化树的准确性,常用于系统发育分析前的对齐质量控制,支持格式:FASTA, CLUSTAL, PHYLIP 等。
2025-05-14 10:33:26
743
原创 python ete3包介绍
ETE3(Evolutionary Tree Environment 3)是一个用于构建、分析和可视化进化树的 Python 包。它提供了一套完整的工具,支持从简单的树操作到复杂的系统发育分析,广泛应用于生物信息学和进化生物学研究。
2025-05-12 16:39:49
501
原创 T-Coffee 多序列比对软件介绍
T-Coffee (Tree-based Consistency Objective Function For alignment Evaluation)是一款多序列比对 (Multiple Sequence Alignment, MSA) 软件核心特点:一致性加权 (Consistency-based alignment)
2025-05-10 09:29:35
728
原创 多序列比对软件 Clustal Omega 介绍
Clustal Omega 是一款广泛使用的多序列比对工具,由欧洲生物信息学研究所(EMBL-EBI)开发,于 2011 年正式发布。它是经典序列比对工具 Clustal W 和 Clustal X 的升级版本,旨在提供更高效、准确的大规模多序列比对解决方案,尤其适用于处理数百至数千条序列的复杂数据集。
2025-05-09 19:45:44
622
原创 InterProScan介绍
InterProScan 是欧洲生物信息研究所 (EMBL-EBI) 开发的一个功能强大的生物序列分析工具,用于将蛋白质序列注释为已知的蛋白质家族、结构域和功能位点。
2025-05-08 15:34:48
782
原创 CentOS 7 安装OpenJDK 17 JRE
CentOS 7 自带的java 版本为:java version "1.8.0_311", 有些软件的运行需要更高的java版。CentOS 7 自带的默认仓库里 没有 OpenJDK 17,但是 Adoptium 项目(前身 AdoptOpenJDK)提供了稳定的 OpenJDK 17 版本。
2025-05-07 17:43:24
643
原创 HHsuite3 的 HHblits 和 HHsearch比较
HHsearch 在远源同源检测中更灵敏,因其直接基于双 Profile HMM 的概率对齐,能捕捉序列相似性之外的结构和进化保守信号;而 HHblits 作为加速版迭代工具,通过扩大同源序列池间接提升灵敏度,是大规模数据分析的首选。两者互补,共同构成 HH-suite 高灵敏度搜索的核心工具。
2025-05-06 19:53:10
494
原创 Linux /dev/null文件用法介绍
在类 Unix 系统(如 Linux、macOS)里,/dev/null 是一个特殊的设备文件,常被称作 “黑洞” 或者 “空设备”。它的作用是接收并丢弃所有写入的数据,且从它读取数据时会马上返回文件结束符。
2025-05-05 12:05:03
421
原创 HHsuite多序列比对格式转换脚本reformat.pl介绍
reformat.pl 是 HH-suite 工具包中的一个 格式转换脚本 用于 快速转换多序列比对 (MSA) 文件格式,让比对结果能在不同软件/流程中通用。
2025-05-05 11:57:13
443
原创 多序列比对软件MAFFT介绍
MAFFT(Multiple Alignment using Fast Fourier Transform)是一款广泛使用且高效的多序列比对软件,由日本京都大学的Katoh Kazutaka等人开发,最早发布于2002年,并持续迭代优化至今。
2025-05-05 11:49:41
628
原创 美国国家生物技术信息中心NCBI介绍
美国国家生物技术信息中心(National Center for Biotechnology Information,简称 NCBI)是全球生物医学领域最权威的综合性数据资源与技术平台之一,隶属于美国国立卫生研究院(NIH)下属的国家医学图书馆(NLM)。
2025-04-30 19:13:53
1431
原创 AlphaFold蛋白质结构数据库介绍
AlphaFold Protein Structure Database (AlphaFold DB) 是 DeepMind + EMBL-EBI 合作开发的公开蛋白质结构预测数据库,是利用 AlphaFold2/AlphaFold3 AI模型 预测的全基因组级蛋白质三维结构库。
2025-04-30 17:37:27
815
原创 美国国立卫生研究院NIH介绍
NIH(National Institutes of Health) 是美国联邦政府下属的国家级生物医学研究机构,隶属于 美国卫生与公众服务部 (HHS)
2025-04-30 16:09:01
1008
原创 蛋白质数据库InterPro介绍
InterPro 是一个综合性的蛋白质家族、结构域和功能位点注释数据库,由欧洲生物信息研究所(EMBL-EBI)维护。它的核心目标是通过整合多个蛋白质签名数据库,为蛋白质序列提供统一的注释,帮助研究人员识别蛋白质的功能、结构域、家族关系等。
2025-04-30 15:10:40
522
原创 EMBL-EBI介绍
欧洲生物信息学研究所(EMBL-EBI,European Molecular Biology Laboratory - European Bioinformatics Institute)位于英国剑桥附近的欣克斯顿,它是欧洲分子生物学实验室(EMBL)五个分部之一。EMBL 是一个由 27 个国家组成的政府间组织,旨在支持基础生物科学研究。EMBL - EBI 主要专注于生物信息学领域,其使命是为全球科研界提供生物信息资源和数据分析服务。
2025-04-30 15:04:51
494
原创 欧洲分子生物学实验室EMBL介绍
欧洲分子生物学实验室(EMBL,European Molecular Biology Laboratory)是欧洲领先、全球知名的生命科学研究机构之一。它在分子生物学、结构生物学、生物信息学和生物技术等多个方向有重大贡献,并且是很多生物信息数据库和工具的诞生地。
2025-04-30 14:55:32
940
原创 Pfam数据库介绍
Pfam 数据库是一个广泛用于对蛋白质序列进行家族和结构域分类的重要资源,为分析新基因组、宏基因组以及指导特定蛋白质和系统的实验工作提供了有力支持。
2025-04-30 14:34:26
428
原创 HHsuite同源序列搜索数据库构建
HHsuite 是用于蛋白质序列比对和同源性检测的工具套件,它使用特定的数据库格式以实现高效的数据存储和快速的检索。HHsuite 常用的数据库格式主要基于 FFINDEX(Flat-File Index),这是一种简单而高效的文件索引系统,它将数据文件(如蛋白质序列或 HMM 模型)和对应的索引文件分开存储。这种设计允许快速随机访问数据,而无需将整个数据库加载到内存中,从而提高了处理大型数据库的效率。
2025-04-29 17:41:35
780
原创 Python Transformers 库介绍
Hugging Face 的 Transformers 库是一个用于自然语言处理(NLP)的强大 Python 库,它提供了对各种预训练模型的访问和使用接口。
2025-04-25 20:33:04
715
原创 蛋白质大语言模型ESM介绍
ESM(Evolutionary Scale Modeling)是 Meta AI Research 团队开发的一系列用于蛋白质的预训练语言模型。这些模型在蛋白质结构预测、功能预测和蛋白质设计等领域展现出了强大的能力。
2025-04-25 19:54:34
778
原创 Linux防火墙工具UFW介绍
UFW(Uncomplicated Firewall)是 Ubuntu、Debian 等 Debian 系 Linux 发行版默认的防火墙管理工具,基于 iptables 开发,旨在通过简化的命令行接口(CLI)降低防火墙配置门槛,适合新手和简单场景。
2025-04-25 15:02:18
1080
原创 CentOS系统防火墙服务介绍
CentOS 系统使用的是 firewalld 防火墙服务(从 CentOS 7 开始),它基于 zone(区域) 和 service(服务) 的机制来配置网络访问控制,替代了传统的 iptables。
2025-04-25 14:44:35
369
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人