AI in Bio-优快云博客

打开文件时，可指定读取模式（‘r’）、写入模式（‘w’）、附加模式（‘a’）、读取为二进制模式(‘rb’)、写入为二进制模式(‘wb’)或让你能够读取和写入文件的模式（‘r+’）。以附加模式(“a”)打开文件时，Python不会在返回文件对象前清空文件，写入到文件的行都将添加到文件末尾。如果要在with代码块外访问文件的内容，可在with代码块内将文件的各行存储在一个列表中，并在with代码块外使用该列表。用于文件对象（open打开文件并读取，返回一个对象，并将对象存储为一个变量ob，

2024-08-29 16:42:12 1529

原创 scipy相关知识笔记

SciPy 的 scipy.io 模块提供了很多函数来处理 Matlab 的数组。

2024-07-03 23:10:45 278

原创生信分析中常用的 linux 知识

qcovus, 即 query coverage per uniq subject，qcovus计算所采用的也是一对query/subject所有HSP query length之和除以query序列的总长度，但其query length之和的计算方法，不再是简单地将所有HSP的query length相加，而是要去除掉不同HSP的query length之间的重叠部分。HSP是high scoring pair的首字母缩写，BLAST结果中的每一行就是一个HSP。echo相当于print。

2024-06-10 21:14:43 2410 1

原创 numpy相关知识笔记

numpy

2024-06-10 21:09:15 332

原创 Pandas相关知识笔记

df.iloc[1:3, 1:3]` # 选择第二行到第三行的第二列到第三列的区域。通过行和列的索引，来选择 DataFrame 中的数据。# 选择第一行第二列的元素。

2024-06-10 20:17:43 319

原创 matplotlib.pyplot相关知识笔记

matplotlib.pyplot相关知识笔记

2024-06-10 16:53:21 499

原创 python中列表_字典_元组相关知识笔记

python中列表相关知识的笔记

2024-06-10 16:24:36 337

原创 git 使用总结

下载 git bash：http://git-scm.com/download/win。文件夹右键通过 git bash 进入。

2024-11-30 00:12:29 481

原创代谢组学笔记

代谢组学检测80-1500道尔顿的小分子。

2024-09-06 00:10:51 214

原创 mNGS(宏基因组)_分析流程

30指的是要求PE的两条read同时和PE的adapter序列比对，匹配度加起来超30%，那么就认为这对PE的read含有adapter，并在对应的位置需要进行切除【注】。10和前面的30不同，它指的是，我就什么也不管，反正只要这条read的某部分和adpater序列有超过10%的匹配率，那么就代表含有adapter(接头)了，需要进行去除。【注】测序的时候往往只会在测到一些部分的adapter，因此read和adaper的时候肯定是不需要要求百分百匹配率的，上述30%和10%其实是比较推荐的值。

2024-09-05 23:48:05 2377 1

原创文本处理三剑客_grep

【代码】文本处理三剑客_grep。

2024-09-05 23:35:06 245

原创文本处理三剑客_awk

第7列字段不包含root尾巴的行，打印第1列和第7列。打印第1列内容，并在后面加上"打印每一行的行号，行号是从1开始，不是0。第1列字段包含root的行，打印出来。打印最后一行的行号(即显示总行数)两个文件打印行号，分别从1开始。+、-、*、/：加、减、乘、除。打印第二行，print可省略。以root开头的行打印出来。打印行号和每一行的内容。打印第二行的最后一列。

2024-09-05 23:31:21 460

原创 shell_bash相关知识笔记

当你在命令中使用反引号包围一个命令时，这个命令会在执行后被替换为其标准输出。这样可以将命令的输出赋值给变量，或者将其作为另一个命令的参数使用。

2024-09-05 18:40:29 385

原创在linux环境中进行文件归档和压缩

gunzip 命令用于解压缩 .gz 文件。

2024-09-05 18:03:24 379

原创使用prodigal预测基因

prodigal可用于对基因组核苷酸文件(.fna) 进行预测基因，可以生成基因的核苷酸格式文件、氨基酸格式文件和结构注释文件。-f #默认是gbk格式，选择gff格式会使out.gff文件的格式更可读。-p #数据类型，single or meta。-o #基因结构注释文件, 输出基因位置等信息。-d #预测的基因的核苷酸文件。-a #预测的基因蛋白质文件。直接对输出文件重命名了！

2024-09-05 17:27:34 890

原创使用with在python程序中进行文件读取、写入和存储

在python程序中进行文件读取、写入和存储。

2024-09-02 23:19:37 714

原创 python文件路径方法

【代码】在python程序中快捷创建文件保存目录。

2024-09-02 18:30:35 308

原创在python程序中使用try-except-else进行异常处理

Python尝试执行try代码块中的代码；只有可能引发异常的代码才需要放在try语句中。一些仅在try代码块成功执行时才需要运行的代码应放在else代码块中。注：pass和return None: pass是一个占位符，表示暂时还没想好怎么处理这一块的代码；return None表示调用函数什么也不返回。例如：运行读取文件，如果成功读取，接着运行计数功能；如果运行遇到error，pass掉这个文件。

2024-09-02 18:16:38 336

原创 R中的排序问题(文本排序和数字排序)

【代码】R中的排序问题。

2024-08-22 15:37:33 182

原创 pycharm的一些使用细节

在PyCharm的Python Console中执行的命令会影响到当前的项目环境，你可以访问、创建或修改变量和函数，这些变更将保持在整个会话中。在Python中，如果您使用了第三方包（例如pandas或openpyxl），这些第三方包所依赖的其他包通常会在引入第三方包时自动导入(即使没有显式导入)。这是因为第三方包通常会在其内部使用其他包的功能，因此在使用第三方包时，它们需要确保其依赖的其他包也能被正确导入。最好还是在代码中显式地导入所有需要使用的包，包括第三方包和其依赖的其他包。

2024-08-09 16:09:01 445

原创使用scrapy进行爬虫操作(python)

先找到安装scrapy的目录：打开cmd命令行，先用cd命令转到该目录下的venv\scripts\，再键入命令：scrapy startproject test1，即可创建一个新的项目。需要修改的文件：items.py(items数据文件), pipelines.py(管道文件), setting.py(设置文件)int.py(初始化文件), middlewares.py(中间件文件), scrapy.cfg(项目的配置文件)不需要修改。通常将这些数字定义在0-1000范围内。

2024-08-09 15:34:26 500

原创格式化字符串(python)

【代码】格式化字符串(python)

2024-08-08 11:31:25 172

原创选择结构和循环结构(python)

【代码】循环结构(python)

2024-08-03 20:05:45 198

原创使用 requests 访问网页_基于python

使用 requests 访问网页

2024-06-10 16:12:08 156

原创使用Selenium爬虫自动操作网页_基于python

使用Selenium爬虫自动操作网页

2024-06-10 15:52:03 814

原创使用BeautifulSoup解析html_基于python

Beautiful Soup是Python的一个HTML或XML的解析库，可以用它来方便地从网页中提取数据。

2024-06-10 14:48:55 471

liuwei6843的博客

原创 linux常用命令

原创 python的一些细节