
Python
Leesuha
这个作者很懒,什么都没留下…
展开
-
用Python比较两个csv文件的ID,将查找到的ID信息提取出来
需要将ID.csv的蛋白质从name_or.csv中找到,并补充name和organism信息,最后写入了seq_sim_all.csv中ID.csvname_or.csvseq_sim.all.csvimport csvf = open('seq_sim_all.csv', 'w', encoding = 'utf-8', newline='')csv_writer = csv.writer(f)csv_writer.writerow(['Database ID', 'Name', '原创 2020-06-24 21:10:58 · 1848 阅读 · 0 评论 -
用Python按照规则写入csv文件
读取txt文件,将每一个簇按照ID互相组合,写入csv文件。这是为了记录每一个蛋白和哪些蛋白具有100%的相似性,是一个全排列的问题。import csvf = open('seq_sim.csv', 'w', encoding = 'utf-8',newline='') csv_writer = csv.writer(f)csv_writer.writerow(['100% Identity Protein ID', 'Database ID', 'Name', 'Organism'])wi原创 2020-06-24 21:03:26 · 263 阅读 · 0 评论 -
用Python取出两个特殊字符中间的字符串
我们要使用ID建表,需要取出100%的ID,ID前为’_’,后为‘.’。ID即为图中1275和1655cd2.txtcd3.txtwith open('cd2.txt', 'r') as f: lines = f.readlines()with open('cd3.txt', 'w') as f_w: for i in range(len(lines) - 1): if(lines[i][0] == '>'): f_w.write(原创 2020-06-24 20:22:04 · 5139 阅读 · 1 评论 -
使用Python删除具有某些特征的几行数据
进行数据整理时所写的脚本,使用CD-HIT去冗余,设置阈值为100%,将有多条的簇留下来。cd1.txt:从上图中找出找出100%的簇,放到cd2.txt中cd2.txtwith open('cd1.txt', 'r') as f: lines = f.readlines()#按行读取文件with open('cd2.txt', 'w') as f_w: for i in range(len(lines)): if(lines[i][0] == '0' and原创 2020-06-24 20:05:46 · 1239 阅读 · 0 评论 -
Jupyter使用Python3 错误:ImportError: DLL load failed while importing error: 找不到指定的模块。
【可以解决但是还是不太懂】使用pip安装Jupyter notebook之后,默认支持Python2,在其基础上安装基于python3的内核即可。安装完成之后,使用Python3的时候出现错误:ImportError: DLL load failed while importing error: 找不到指定的模块。并且服务器一直启动不起来,一直正在连接最后就崩了。查找教程有些说将路径添加到path里,但是我用conda装的,已经添加进去了,感觉也没什么问题,而且第一次成功使用了。最后发现使原创 2020-06-10 16:31:44 · 7215 阅读 · 7 评论