生物信息学中的虚拟测序与蛋白质结构分析
1. 虚拟测序 pUC18c
1.1 虚拟测序基础数据
在虚拟测序 pUC18c 的过程中,有一些基础数据需要关注。预期在 MSP 中的残基得分是 1.861,由此可推出预期的 MSP 长度为 21。对于 2686 与 3364 个残基的情况,会产生 1807 万个点。只有在退出 dotter 后,才能回到命令行提示符。图 20.3 中的对角线表示测序仪生成的与 pUC18c DNA 序列完全匹配的 DNA 片段,正斜率的线表示来自反向 DNA 链的序列,反之亦然。
1.2 序列组装
1.2.1 生成与组装序列
在终端 274 的第 3 行,我们生成了测序片段并将其保存到名为 output 的文件中。接下来,使用 TIGR 组装器来组装这些序列,以恢复原始的 pUC18c 序列。组装后的序列片段被称为重叠群(contigs)。运行 TIGR 组装器的命令如下:
# 列出测序目录的内容
$ ls -lh
# 运行 TIGR 组装器
$ run_TA output
# 再次列出目录内容
$ ls -lh
如果在运行过程中收到错误消息,可能需要将 TIGR 组装器重新添加到系统路径中,可使用以下命令:
PATH =∼/Sequencing/TIGR_Assembler_v2/bin : $PATH; export PATH
然后重试。
超级会员免费看
订阅专栏 解锁全文
74

被折叠的 条评论
为什么被折叠?



