27、在线使用 FARFAR2 进行 RNA 3D 建模及 RNAMake 自动化设计 RNA 纳米结构

在线使用 FARFAR2 进行 RNA 3D 建模及 RNAMake 自动化设计 RNA 纳米结构

在线使用 FARFAR2 进行 RNA 3D 建模

在 RNA 3D 建模过程中,有一些特殊的条件和操作需要注意。在低分辨率阶段,有一个重要的修改条件,这最初是在 Das 实验室进行逐步蒙特卡罗基准测试时添加到 Rosetta 中的。用户可以选择从片段库中排除与天然结构过于相似的同源片段。例如,若以像 5Y87 这样的扭结姐妹核酶结构作为测试 FARFAR2 的基准案例,而片段库中存在来自该核酶的片段,那测试就不公平了。片段排除算法会查看天然 PDB 中的每个 6 聚体序列,移除那些在序列上与这些 6 聚体匹配,且替换后会导致构象与天然构象的均方根偏差(RMSD)小于给定半径的片段。对于可能被移除的序列匹配,默认是匹配嘌呤/嘧啶身份,但也可以完全忽略序列或要求精确的序列匹配。对于 RNA - Puzzle 20 的 PDB 5Y87,我们按照 FARFAR2 研究,提供 1.2 Å 的 RMSD 半径。

用户可能有外部实验数据来指导建模过程。核磁共振(NMR)化学位移可以使用 STAR 2.1 格式的变体来指定。完整的 CS - ROSETTA - RNA 协议的详细信息在 Rosetta 演示中广泛记录,可在 此处 查看,应用文档可在 此处 查看。用化学位移评分增强 FARFAR2 建模只需要指定如这里所述的 STAR 2.1 格式的化学位移文件。

整个 RNA 结构所需的结构数量因其大小和复杂性而有很大差异。插入的 T 环三级接触的存在有助于建模,因为该三级接触足以使整个 RNA 形成球状折叠,并限制了可能的低能量结构。在最初的盲测挑战和后续的模拟基准测试中,我们仅用几千个模型就能生成与晶体结构的 RMSD 小于 4.0 Å 的结构。对于 RNA - Puzzle 20 的扭结姐妹核酶 5Y87,我们生成 20,000 个模型,只是为了对这项工作的建模问题进行全面探索。

FARFAR2 ROSIE 服务器为扭结姐妹问题提供了一组与第一个假结基准案例类似的数据,不过有一些小差异。因为在这个例子中我们提供了天然 PDB 结构,所以服务器不会将集合重新评分到最低能量模型。相反,它会绘制分数与到提供的天然结构的 RMSD 的关系图。部分原因是模板和目标结构之间 T 环构象的高度相似性,使得该方法在这种复杂建模问题上取得成功。生成的集合可以类似地解释为上面更简单的假结建模问题,不过由于这里指定了天然结构作为参考,最低 RMSD 结构肯定是最接近天然的。所以远离天然结构的能量最小值一定表明评分函数存在问题。在这种情况下,网络服务器自动生成的前 10 个聚类中心的平均模型间 RMSD 为 7.6 Å,表明与天然结构的最小聚类 RMSD 为 9.9 ± 1.9 Å。实际上,这些聚类都与实验结构相当相似,范围从 5.3 到 9.3 Å,最佳聚类的 RMSD 显著优越,仅为 3.91 Å。这表明使用如此准确的模板显著有助于结构预测超出预期。

实验数据可以显著提高 RNA 建模的收敛性和准确性。FARFAR2 ROSIE 服务器能够很好地处理两种实验数据,即 MOHCA 和 NMR 1H 化学位移数据。

MOHCA 和 MOHCA - seq 实验使用连接的羟基自由基源和测序读数来发现核苷酸 - 核苷酸接近的“强”和“弱”信号。这些信号可用于指导 FARFAR2 建模;每个信号会产生一个约束,表达为两个函数的和,其权重由约束的强度给出。例如,链 A 中核苷酸 2 和 38 的 O2’和 C4’原子之间的“强”约束可通过以下方式指定:

AtomPair O2’ 2A C4’ 38A FADE 0 30 15 -4.00 4.00
AtomPair O2’ 2A C4’ 38A FADE -99 60 30 -36.00 36.00

如果省略链字母,Rosetta 会将序列位置解释为 PDB 内的绝对编号(即从 1 开始顺序编号),这可能与用户 PDB 的编号不匹配。FADE 约束的参数在 此处 描述。上述指定给出了一个惩罚,当原子间距离从 15 Å 向下到 0 Å 以及向上到 30 Å 时,惩罚会平滑地增加到 4 个 Rosetta 能量单位,如果原子间距离超过 30 Å,则会额外增加高达 36.0 个 Rosetta 单位的惩罚。“弱”约束为:

AtomPair O2’ 2A C4’ 38A FADE 0 30 15 -0.80 0.80
AtomPair O2’ 2A C4’ 38A FADE -99 60 30 -7.20 7.20

即“强”约束强度的五分之一。

我们展示了在霍乱弧菌 c - di - GMP 核糖开关(PDB 代码:3IRW)上进行的 FARFAR2 ROSIE 服务器模拟结果,有和没有 MOHCA - seq 约束的情况。与使用 FARFAR 的原始协议不同,FARFAR2 不需要预先生成螺旋集合、手动选择要最小化的模型或手动选择要聚类的模型部分。有约束的模拟更接近晶体构象:其第二低能量聚类的 RMSD 为 5.52 Å,而无约束模拟的前 10 个聚类中最接近的为 8.91 Å。这种优势并非偶然;有约束模拟产生的模型中超过一半的 RMSD 小于 8.0 Å,而无约束模拟中这一比例小于 1%。

1H 化学位移本身可以为约束 RNA 折叠提供强大的信息,在许多情况下无需额外的 NMR 实验就能实现原子级精度。由于 FARFAR2 协议在基线方面的改进,与原始 CS - Rosetta - RNA 研究相比,基准案例的性能差异不像早期采样协议和评分函数(FARFAR 而非 FARFAR2)那样明显。尽管如此,1H 化学位移带来的改进仍然明显,如串联 GA 错配案例 1MIS 所示。对两个 500 个结构的集合进行比较表明,由化学位移指导的建模对距离实验结构超过 2.0 Å 的模型产生了更严厉的分数惩罚(能量差距为 16.0 而非 9.8 个 Rosetta 能量单位)。

RNAMake 自动化设计 RNA 纳米结构

新兴的 RNA 纳米技术领域试图利用 RNA 的独特结构特性为生物医学生成纳米级机器。与其他生物分子不同,RNA 的三级结构由离散且重复出现的子结构组成,称为三级“基序”。许多这些三级基序尽管出现在不同的结构背景中,但会采用相似的三维(3D)构象。利用对称性、基序重复和专家建模,这些基序已被组装成合理设计的结构,包括多边形、立方体和薄片。然而,在 RNA 3D 纳米结构的合理设计中面临两个突出问题:一是合理设计的 RNA 缺乏天然 RNA 机器中观察到的复杂性,天然 RNA 机器包含更多不同的相互作用基序,从而产生生物 RNA 世界中观察到的功能;二是三级基序虽然有些可以近似为刚性块,但它们是热力学实体,最好用结构集合来表示。已知有些基序会因小分子结合物而发生构象的根本变化。要最终构建能够响应细胞环境的 RNA 设备,需要详细描述每个基序的构象热力学。

RNAMake 是第一个将 RNA 基序组装成紧凑纳米结构的软件包。它包含一个广泛的基序字典,其中包括来自高分辨率晶体学结构的近 1000 个基序,并提供枚举“寻路”算法来迭代构建解决 3D 设计问题所需的基序。在最初的研究中,RNAMake 面临了三个设计挑战。首先,重新解决了一个有 20 年历史的问题,即设计一种 RNA,使四环/四环受体(TTR)的两部分在单个紧凑的 RNA 链内对齐。总共生成了 16 个解决“miniTTR”问题的方案,通过化学映射、Mg2 + 滴定和天然凝胶电泳的组合,我们观察到有力的证据表明 16 个构建体中有 11 个按设计折叠,其中 1 个通过晶体学证实了几乎整个折叠的原子级精度。其次,通过在核糖体的 23S 和 16S rRNA 之间构建连接物,生成了单链核糖体,该单链 RNA 支持大肠杆菌的生长。这个 3D 设计挑战需要解决超过 100 Å 距离的 RNA 基序寻路问题,并避免与核糖体的 RNA 和蛋白质成分发生空间碰撞。最后,证明了 RNAMake 可以改善两个人工选择的 RNA 适体的结合特性。通过利用 RNAMake 添加外围三级接触,将这些人工适体“锁定”在其结合构象中,即使在没有配体的情况下也是如此。这种锁定接触可以选择性地增加未结合状态的自由能,从而改善与结合状态的自由能差,导致对小分子目标的亲和力更好。

RNAMake 的另一个特点是对螺旋和一些简单基序的构象热力学描述。螺旋被分解为碱基对步(即两个连续的碱基对),这允许用最少的结构状态集对任意螺旋序列进行建模。碱基对步的构象集合是通过汇编 RNA 晶体结构数据库中结构化 RNA 中该碱基对步的所有实例来确定的。

以下是一个简单的流程图,展示了 FARFAR2 建模和 RNAMake 设计的大致流程:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([开始]):::startend --> B{FARFAR2 建模或 RNAMake 设计}:::decision
    B -->|FARFAR2 建模| C(准备输入数据):::process
    C --> D(运行建模过程):::process
    D --> E(分析结果):::process
    B -->|RNAMake 设计| F(确定设计问题):::process
    F --> G(选择基序和算法):::process
    G --> H(生成设计方案):::process
    H --> I(评估设计方案):::process
    E --> J([结束]):::startend
    I --> J

总的来说,FARFAR2 的 ROSIE 服务器为 Rosetta 的复杂 RNA 折叠从头建模应用提供了一个网络界面,适用于不同专业水平的用户。建模的重要阶段,如将建模集合减少到少数代表性结构,都实现了自动化,使用户既能获得完整的建模输出,又能得到最重要的模型及其预期精度。虽然 RNA 分子的计算需求仍然很高,实现复杂相互作用的原子级精度仍然困难,但 ROSIE 界面确保了非专业人员能够以跟上不断发展的状态访问 Rosetta RNA 建模代码。而 RNAMake 软件则为解决 RNA 3D 纳米结构设计中的挑战提供了有效的工具,通过自动化基序组装和提供热力学描述,有望推动 RNA 纳米技术的发展。

在线使用 FARFAR2 进行 RNA 3D 建模及 RNAMake 自动化设计 RNA 纳米结构

FARFAR2 建模与 RNAMake 设计的详细操作要点

在使用 FARFAR2 进行 RNA 3D 建模时,针对不同的输入条件和实验数据,有一系列详细的操作要点需要注意。以下是一个操作要点的列表:
1. 片段排除操作
- 当选择从片段库中排除与天然结构过于相似的同源片段时,首先要明确基准案例的天然 PDB 结构。例如对于 RNA - Puzzle 20 的 PDB 5Y87,要按照研究提供 1.2 Å 的 RMSD 半径。
- 利用片段排除算法,查看天然 PDB 中的每个 6 聚体序列,确保移除那些在序列上与这些 6 聚体匹配且替换后构象与天然构象的 RMSD 小于给定半径的片段。
- 对于可能被移除的序列匹配方式,可根据需求选择默认的匹配嘌呤/嘧啶身份,或者完全忽略序列、要求精确的序列匹配。
2. 实验数据利用
- NMR 化学位移 :使用 STAR 2.1 格式的变体指定 NMR 化学位移。可参考 Rosetta 演示( 此处 )和应用文档( 此处 )来了解完整的 CS - ROSETTA - RNA 协议。
- MOHCA - seq 约束 :在指定 MOHCA - seq 约束时,要注意链字母的使用。如链 A 中核苷酸 2 和 38 的 O2’和 C4’原子之间的“强”约束指定如下:

AtomPair O2’ 2A C4’ 38A FADE 0 30 15 -4.00 4.00
AtomPair O2’ 2A C4’ 38A FADE -99 60 30 -36.00 36.00
若省略链字母,Rosetta 会将序列位置解释为 PDB 内的绝对编号,可能与用户 PDB 的编号不匹配。“弱”约束则是“强”约束强度的五分之一,指定方式类似。
  1. 结构数量确定 :根据 RNA 的大小和复杂性确定要生成的结构数量。如对于 RNA - Puzzle 20 的扭结姐妹核酶 5Y87,生成 20,000 个模型以全面探索建模问题。
  2. 结果分析 :FARFAR2 ROSIE 服务器会根据是否提供天然 PDB 结构进行不同的处理。若提供了天然结构,服务器会绘制分数与到天然结构的 RMSD 的关系图。分析生成的集合时,要注意远离天然结构的能量最小值可能表明评分函数存在问题。

而在使用 RNAMake 进行 RNA 纳米结构设计时,也有相应的操作要点:
1. 设计问题确定 :明确要解决的设计问题,如设计包含单个三级接触的最小 RNA 序列、生成稳定小分子配体的 RNA、构建连接核糖体亚基的系链等。
2. 基序和算法选择 :利用 RNAMake 中广泛的基序字典,选择合适的基序。同时,可使用新的蒙特卡罗设计算法来解决设计问题。
3. 设计方案生成与评估 :通过枚举“寻路”算法迭代构建解决 3D 设计问题所需的基序,生成设计方案。然后通过化学映射、Mg2 + 滴定、天然凝胶电泳等方法评估设计方案的折叠情况和性能。

两种工具的对比与应用前景

为了更清晰地了解 FARFAR2 和 RNAMake 的特点,下面通过一个表格进行对比:
| 工具 | 功能特点 | 适用场景 | 优势 | 局限性 |
| ---- | ---- | ---- | ---- | ---- |
| FARFAR2 | 进行 RNA 3D 建模,可结合外部实验数据(如 NMR 化学位移、MOHCA - seq 约束)提高建模准确性 | 适用于各种复杂 RNA 结构的建模,尤其是有天然结构参考的情况 | 能够利用实验数据改善建模结果,服务器自动化程度高,方便不同专业水平的用户使用 | 计算需求高,实现复杂相互作用的原子级精度困难 |
| RNAMake | 自动化设计 RNA 纳米结构,提供基序字典和寻路算法,可进行热力学计算 | 适用于解决各种 RNA 纳米技术相关的设计问题,如构建特定功能的 RNA 结构 | 能够解决复杂的 RNA 基序组装问题,改善 RNA 适体的结合特性,提供热力学描述 | 对于一些复杂的天然 RNA 结构的设计可能仍存在挑战 |

这两种工具在 RNA 研究领域都具有重要的应用前景。FARFAR2 可以帮助研究人员更准确地预测 RNA 的 3D 结构,为理解 RNA 的功能和作用机制提供基础。而 RNAMake 则为 RNA 纳米技术的发展提供了强大的支持,有望推动纳米级 RNA 机器的设计和构建,为生物医学领域带来新的突破。例如,在药物研发中,准确的 RNA 结构建模可以帮助设计更有效的 RNA 药物;在纳米医学中,设计的 RNA 纳米结构可以用于药物递送、疾病诊断等方面。

以下是一个流程图,展示了在实际应用中如何根据需求选择 FARFAR2 或 RNAMake:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([开始]):::startend --> B{需求类型}:::decision
    B -->|RNA 3D 结构建模| C{FARFAR2 适用条件}:::decision
    C -->|有实验数据或天然结构参考| D(使用 FARFAR2 建模):::process
    C -->|无实验数据且结构简单| E(考虑其他简单建模方法):::process
    B -->|RNA 纳米结构设计| F{设计问题类型}:::decision
    F -->|复杂基序组装或适体优化| G(使用 RNAMake 设计):::process
    F -->|简单结构设计| H(考虑其他设计方法):::process
    D --> I([结束]):::startend
    E --> I
    G --> I
    H --> I

综上所述,FARFAR2 和 RNAMake 作为 RNA 研究领域的重要工具,各自具有独特的功能和优势。通过合理使用这两种工具,研究人员可以在 RNA 3D 建模和纳米结构设计方面取得更好的成果,推动 RNA 相关领域的发展。

内容概要:本文系统阐述了Java Persistence API(JPA)的核心概念、技术架构、核心组件及实践应用,重点介绍了JPA作为Java官方定义的对象关系映射(ORM)规范,如何通过实体类、EntityManager、JPQL和persistence.xml配置文件实现Java对象与数据库表之间的映射与操作。文章详细说明了JPA解决的传统JDBC开发痛点,如代码冗余、对象映射繁琐、跨数据库兼容性差等问题,并解析了JPA与Hibernate、EclipseLink等实现框架的关系。同时提供了基于Hibernate和MySQL的完整实践案例,涵盖Maven依赖配置、实体类定义、CRUD操作实现等关键步骤,并列举了常用JPA注解及其用途。最后总结了JPA的标准化优势、开发效率提升能力及在Spring生态中的延伸应用。 适合人群:具备一定Java基础,熟悉基本数据库操作,工作1-3年的后端开发人员或正在学习ORM技术的中级开发者。 使用场景及目标:①理解JPA作为ORM规范的核心原理与组件协作机制;②掌握基于JPA+Hibernate进行数据库操作的开发流程;③为技术选型、团队培训或向Spring Data JPA过渡提供理论与实践基础。 阅读建议:此资源以理论结合实践的方式讲解JPA,建议读者在学习过程中同步搭建环境,动手实现文中示例代码,重点关注EntityManager的使用、JPQL语法特点以及注解配置规则,从而深入理解JPA的设计思想与工程价值。
先看效果: https://pan.quark.cn/s/d787a05b82eb 西门子SCALANCE X系列交换机是西门子公司所提供的工业以太网交换机产品系列,其在工业自动化领域具有广泛的应用。 如果在应用期间遭遇固件升级失误或采用了不相容的固件版本,可能会导致交换机无法正常启动。 在这种情况下,通常能够借助FTP(文件传输协议)来恢复交换机的固件,从而使其恢复正常运作。 本文件详细阐述了利用FTP修复SCALANCE X系列交换机固件的方法,并具体说明了实施步骤。 当SCALANCE X系列交换机的固件出现故障时,设备在启动后会自动激活引导加载程序,并通过故障LED的闪烁来表明设备处于特殊情形。 在这种情形下,交换机能够充当FTP服务器,与客户端建立联系,执行固件数据的传输。 需要特别强调的是,对于SCALANCE X200系列交换机,必须经由端口1来连接FTP客户端。 在实施步骤方面,首先需要为交换机指定一个IP地址。 这一步骤通常借助西门子公司提供的PST(Product Support Tools)软件来实施。 在成功配置IP地址之后,就可以通过FTP协议与交换机内部的FTP服务器建立连接,并借助FTP客户端将固件文件传输到交换机。 需要留意的是,在传输固件文件之前,应当先从西门子技术支持网站获取对应订货号的固件版本文件。 一旦固件文件备妥,就可以开始FTP操作。 这通常涉及打开操作系统的DOS窗口,运用FTP指令连接到交换机的FTP服务器,并输入正确的用户名和密码进行身份验证。 在本案例中,用户名和密码均为“siemens”,并且传输模式设定为二进制。 随后,使用FTP的“put”指令将本地固件文件上传至交换机。 值得留意的是,固件文件名必须严格遵循大小写规则。 上传成功后,...
源码地址: https://pan.quark.cn/s/f24fc84966ae 人机交互在电子工程领域中占据着核心地位,它具体指的是单片机系统与用户之间进行信息交换和管理操作的方法。 在此过程中,单片机系统负责接收用户的输入信号,对收集到的信息进行加工处理,并通过特定媒介将处理结果呈现给用户,这些媒介包括但不限于显示器、LED指示灯以及蜂鸣器等设备。 在本探讨的主题中,我们将重点研究按键与1602液晶显示屏之间的交互机制。 1602液晶显示屏是单片机应用领域中一种极为常见的人机交互界面设备,其功能在于能够显示两行文本,每行包含16个字符。 此类显示器通常采用串行或并行接口与单片机设备进行连接,主要用途是展示程序运行的状态信息、数据读取的最终结果以及其他相关的重要资讯。 我们需要深入理解如何对1602液晶显示屏进行配置和控制。 这一过程通常涉及到初始化序列的执行,其中包括设定显示模式(例如开启/关闭状态、光标移动的方向以及是否启用闪烁效果),同时选择合适的数据传输方式(4线或8线模式)。 单片机系统必须向液晶显示屏发送特定的指令集,以此来设定上述参数。 举例来说,可以通过RS(寄存器选择)、RW(读写信号)以及E(使能)引脚与LCD设备进行通信。 接下来,我们将详细讨论按键接口的设计方案。 按键通常作为输入设备存在,允许用户向单片机系统发送指令或数据。 在单片机系统中,按键通常与IO端口相连接,通过检测IO端口电平的变化来判断按键是否被触发。 对于基础的按键应用场景,可能仅需检测按键闭合时产生的低电平信号;而对于更为复杂的应用场景,则可能需要处理消抖问题,以防止因机械接触产生的瞬间抖动导致错误的读数。 在Proteus软件环境中,我们可以构建虚拟的电路模型来模拟单片机系统,其中包括1...
数据集介绍:垃圾分类检测数据集 一、基础信息 数据集名称:垃圾分类检测数据集 图片数量: 训练集:2,817张图片 验证集:621张图片 测试集:317张图片 总计:3,755张图片 分类类别: - 金属:常见的金属垃圾材料。 - 纸板:纸板类垃圾,如包装盒等。 - 塑料:塑料类垃圾,如瓶子、容器等。 标注格式: YOLO格式,包含边界框和类别标签,适用于目标检测任务。 数据格式:图片来源于实际场景,格式为常见图像格式(如JPEG/PNG)。 二、适用场景 智能垃圾回收系统开发: 数据集支持目标检测任务,帮助构建能够自动识别和分类垃圾材料的AI模型,用于自动化废物分类和回收系统。 环境监测与废物管理: 集成至监控系统或机器人中,实时检测垃圾并分类,提升废物处理效率和环保水平。 学术研究与教育: 支持计算机视觉与环保领域的交叉研究,用于教学、实验和论文发表。 三、数据集优势 类别覆盖全面: 包含三种常见垃圾材料类别,覆盖日常生活中主要的可回收物类型,具有实际应用价值。 标注精准可靠: 采用YOLO标注格式,边界框定位精确,类别标签准确,便于模型直接训练和使用。 数据量适中合理: 训练集、验证集和测试集分布均衡,提供足够样本用于模型学习和评估。 任务适配性强: 标注兼容主流深度学习框架(如YOLO等),可直接用于目标检测任务,支持垃圾检测相关应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值