- 博客(12)
- 收藏
- 关注
原创 Snakemake报错Outputs of incorrect type
Snakemake报错Outputs of incorrect type
2022-08-17 12:10:08
321
原创 根据ProteinID,去掉.faa文件中冗余的protein序列,并记录organism于蛋白名称中
目的如题。准备:Allwp.faa保存于D:\PyCharm\py_code\test 将以下代码写入MoveRedundancy.py中,并分段运行 创建文件夹D:\PyCharm\py_code\test\AllWP备注:NCBI中不同的Organism可能含有相同的蛋白。Allwp.faa包含冗余蛋白序列,中蛋白名称的格式为:organism1(ProteinID1), organism2(ProteinID2)。欲对Allwp.faa去...
2021-10-21 22:49:04
1553
1
原创 合并多个fasta文件,并重命名基因名称
准备: 将多个fasta文件置于D:\PyCharm\py_code\test\RC和D:\PyCharm\py_code\test\KS路径中 以下代码保存于D:\PyCharm\py_code\test\MergeFasta.py,运行即可得到AllFasta.fasta备注:原本fasta的基因名称为NCBI上的名称,重命名后为(Organism)ProteinID.faa,RC和KS即Organismimport osdef MergeFasta(pa...
2021-10-21 15:30:43
4133
原创 批量解压NCBI下载的Protein压缩包,重命名Protein.faa,最后将所有Protein.faa整合到一个fasta中
准备:压缩包分别存储在D:\PyCharm\py_code\test\195和D:\PyCharm\py_code\test\CBDB1中,并于该路径新建BatchUnzip.py以下代码保存于BatchUnzip.py,运行即可得到(Organism)ProteinID.faa和AllProtein.faa备注:从NCBI下载的压缩包中,序列存储在*.zip\ncbi_dataset\data路径中import zipfileimport os#解压...
2021-10-20 23:02:10
1083
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人