- 博客(27)
- 收藏
- 关注

原创 python的一些细节
打开文件时,可指定读取模式(‘r’)、写入模式(‘w’)、附加模式(‘a’)、读取为二进制模式(‘rb’)、写入为二进制模式(‘wb’)或让你能够读取和写入文件的模式(‘r+’)。以附加模式(“a”)打开文件时,Python不会在返回文件对象前清空文件,写入到文件的行都将添加到文件末尾。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各行存储在一个列表中,并在with代码块外使用该列表。用于文件对象(open打开文件并读取,返回一个对象,并将对象存储为一个变量ob,
2024-08-29 16:42:12
1478

原创 生信分析中常用的 linux 知识
qcovus, 即 query coverage per uniq subject,qcovus计算所采用的也是一对query/subject所有HSP query length之和除以query序列的总长度,但其query length之和的计算方法,不再是简单地将所有HSP的query length相加,而是要去除掉不同HSP的query length之间的重叠部分。HSP是high scoring pair的首字母缩写,BLAST结果中的每一行就是一个HSP。echo相当于print。
2024-06-10 21:14:43
2130
1

原创 Pandas相关知识笔记
df.iloc[1:3, 1:3]` # 选择第二行到第三行的第二列到第三列的区域。通过行和列的索引,来选择 DataFrame 中的数据。# 选择第一行第二列的元素。
2024-06-10 20:17:43
256
原创 git 使用总结
下载 git bash:http://git-scm.com/download/win。文件夹右键通过 git bash 进入。
2024-11-30 00:12:29
442
原创 mNGS(宏基因组)_分析流程
30指的是要求PE的两条read同时和PE的adapter序列比对,匹配度加起来超30%,那么就认为这对PE的read含有adapter,并在对应的位置需要进行切除【注】。10和前面的30不同,它指的是,我就什么也不管,反正只要这条read的某部分和adpater序列有超过10%的匹配率,那么就代表含有adapter(接头)了,需要进行去除。【注】测序的时候往往只会在测到一些部分的adapter,因此read和adaper的时候肯定是不需要要求百分百匹配率的,上述30%和10%其实是比较推荐的值。
2024-09-05 23:48:05
1810
原创 文本处理三剑客_awk
第7列字段不包含root尾巴的行,打印第1列和第7列。打印第1列内容,并在后面加上"打印每一行的行号,行号是从1开始,不是0。第1列字段包含root的行,打印出来。打印最后一行的行号(即显示总行数)两个文件打印行号,分别从1开始。+、-、*、/:加、减、乘、除。打印第二行,print可省略。以root开头的行打印出来。打印行号和每一行的内容。打印第二行的最后一列。
2024-09-05 23:31:21
413
原创 shell_bash相关知识笔记
当你在命令中使用反引号包围一个命令时,这个命令会在执行后被替换为其标准输出。这样可以将命令的输出赋值给变量,或者将其作为另一个命令的参数使用。
2024-09-05 18:40:29
287
原创 使用prodigal预测基因
prodigal可用于对基因组核苷酸文件(.fna) 进行预测基因,可以生成基因的核苷酸格式文件、氨基酸格式文件和结构注释文件。-f #默认是gbk格式,选择gff格式会使out.gff文件的格式更可读。-p #数据类型,single or meta。-o #基因结构注释文件, 输出基因位置等信息。-d #预测的基因的核苷酸文件。-a #预测的基因蛋白质文件。直接对输出文件重命名了!
2024-09-05 17:27:34
590
原创 在python程序中使用try-except-else进行异常处理
Python尝试执行try代码块中的代码;只有可能引发异常的代码才需要放在try语句中。一些仅在try代码块成功执行时才需要运行的代码应放在else代码块中。注:pass和return None: pass是一个占位符,表示暂时还没想好怎么处理这一块的代码;return None表示调用函数什么也不返回。例如:运行读取文件,如果成功读取,接着运行计数功能;如果运行遇到error,pass掉这个文件。
2024-09-02 18:16:38
270
原创 pycharm的一些使用细节
在PyCharm的Python Console中执行的命令会影响到当前的项目环境,你可以访问、创建或修改变量和函数,这些变更将保持在整个会话中。在Python中,如果您使用了第三方包(例如pandas或openpyxl),这些第三方包所依赖的其他包通常会在引入第三方包时自动导入(即使没有显式导入)。这是因为第三方包通常会在其内部使用其他包的功能,因此在使用第三方包时,它们需要确保其依赖的其他包也能被正确导入。最好还是在代码中显式地导入所有需要使用的包,包括第三方包和其依赖的其他包。
2024-08-09 16:09:01
312
原创 使用scrapy进行爬虫操作(python)
先找到安装scrapy的目录:打开cmd命令行,先用cd命令转到该目录下的venv\scripts\,再键入命令:scrapy startproject test1,即可创建一个新的项目。需要修改的文件:items.py(items数据文件), pipelines.py(管道文件), setting.py(设置文件)int.py(初始化文件), middlewares.py(中间件文件), scrapy.cfg(项目的配置文件)不需要修改。通常将这些数字定义在0-1000范围内。
2024-08-09 15:34:26
408
原创 使用BeautifulSoup解析html_基于python
Beautiful Soup是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据。
2024-06-10 14:48:55
363
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人