记录一下如何使用pssm进行全数据库氨基酸序列比对

最新推荐文章于 2025-12-19 16:00:26 发布

原创最新推荐文章于 2025-12-19 16:00:26 发布 · 279 阅读

CC 4.0 BY-SA版权

文章标签：

1.首先打开服务器软件

在这里插入图片描述点击Quick Connect,输入密码，连接上自己的服务器。

2.点击左上角的终端窗口

输入ssh node7
再输入conda activate Hhsuite_Psiblast_py36
然后进入自己存文件的路径，
输入nohup psiblast -query /data/home/wangjiuru/JiaYunpeng/pssm_fengpan/again/E5Y379.fasta -db /home/lmy/database/uniref90.fasta -num_iterations 3 -out_ascii_pssm /data/home/wangjiuru/JiaYunpeng/pssm_fengpan/again/outputE5Y379.pssm 2> out.log &

/data/home/wangjiuru/JiaYunpeng/pssm_fengpan/again/E5Y379.fasta 是输入的fasta序列（可以通过目标序列在Uniprot中Blast获取到
/data/home/wangjiuru/JiaYunpeng/pssm_fengpan/again/outputE5Y379.pssm是输出路径	


3.输入top后可以查看运行状态，大概一小时左右即可得到pssm矩阵文件
得到矩阵文件以后，提取其有用信息，即氨基酸序号和名称，以及其他20种氨基酸出现的频数，提取代码为
awk '{print $1, $2, $23, $24, $25, $26, $27, $28, $29, $30, $31, $32, $33, $34, $35, $36, $37, $38, $39, $40,$41,$42}' output.pssm >smart.txt

4.提出来以后，自己把目标氨基酸的挑出来，目标氨基酸由文献、初始位置Pymol中作用力分析、对接后周围氨基酸、模拟50ns最后一帧后6A范围内氨基酸确定。
   然后取除了自己以外的前四名，并列都算，记下名称，写到individual_list.txt文件中
   在MobaXterm的服务器中，用foldx_20241231 -f BuildModel.cfg对其进行指定位点突变
   得到一大堆文件，其中Dif_1qtq.fxout文件的total energy最有用，把文字描述删去后，
   sort -k2,2n Dif_1qtq.fxout > sorted_data.txt
   对其第二列做升序排列，
   记录下编号，去individual_list.txt比对，即可得到初步要改的氨基酸位点及该改成什么。

5.真诚许愿，一定要成功啊，拜托了...