网址: Iterative Refinement Graph Neural Network for Antibody Sequence-Structure Co-design | OpenReview
ICLR 2022的高分论文[8,8,8],目前没有给代码
内容:抗体结合的特异性是由这些Y形蛋白末端的互补决定区(CDR)决定的。这篇论文提出了一个生成模型来同时生成CDR序列和相应的结构,并具有迭代修改已生成子图的能力
有关抗体设计的一些问题
- 挑战:CDR序列的组合搜索空间到了20的60次方,而同时满足亲和力、稳定性与可合成性的解空间较小
- CDR生成的三个关键问题
- 如何对序列及其底层3D结构之间的关系进行建模-->同时设计
- 不考虑结构生成序列会导致次优性能
- 预定义结构再生成序列不适合抗体,因为结构很少是先验已知的
- 如何在给定序列(上下文)剩余部分的情况下对CDR的条件分布进行建模,注意力方法忽略了结构,而结构也是至关重要的
- 如何针对各种属性进行模型优化。传统基于物理的模型关注结合能最小化,本文模型关注的更多
- 如何对序列及其底层3D结构之间的关系进行建模-->同时设计
抗体的组成
- 抗体由一个重链(heavy chain)和一个轻链(light chain)组成,每个重链由一个可变区variable domain (VH/VL)和一些恒定区constant domain 组成。可变区进一步划分为框架区和三个补充性决定区(CDR)。重链上的三个CDR被标记为CDR-H1、CDR-H2、CDR-H3,每个CDR占据一个连续的序列。作为抗体中变异最大的部分,CDRs是结合和中和的主要决定因素-->抗体的设计任务可以认为是CDR的生成任务
模型结构
- 本文只关注VH的CDR的生成,VL的同理
- VH可表示为氨基酸的序列𝑠=𝑠1𝑠2…𝑠𝑛,其中每个si可称为残基(residue)
- 残基的值为20中氨基酸中的一个,或者<MASK>
- 使用主干坐标将其折叠为3D结构
- 阿尔法碳:𝑥𝑖,𝛼
- 碳原子:𝑥𝑖,𝑐
- 阿尔法碳:𝑥𝑖,𝛼
- VH可表示为氨基酸的序列𝑠=𝑠1𝑠2…𝑠𝑛,其中每个si可称为残基(residue)