自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 永久修改R配置加入清华源

修改**.Rprofile**文件在文件中写入。conda 安装的话可以是这里。

2024-11-22 10:17:24 269

原创 R ggplot2 绘图细节 geom_text展示不全 y轴坐标细节 x轴标题

geom_text()展示不全,很有可能是y轴过于短,导致上下没有间隙。会使得y轴的坐标轴上限又变成100,图片展示又不全,非常坑。如果修改代码 ,使用ylim()就可以修复。

2024-11-21 18:02:49 383

原创 修正Z-score检验异常值

‒ 使用MAD(中位数绝对偏差)而不是标准差,这样对异常值更稳健;传统Z-score由于计算样本标准差,容易收到异常数值影响。Z-score主要衡量均值差异,要求数据符合正太分布,且容易收到异常值影响。异常阈值设置:对于较大的数据集,阈值通常设置为3,较小数据集可以修正为2。计算公式:z = (x - mean) / std。‒ 适合非正态分布的数据。

2024-11-05 18:09:22 512

原创 pip配置及换源

修改哪一个config比较好?如果有site层级,直接修改sit层级就ok。每个pip根据不同层级分别调用、更新不同config策略。linux上有多个pip,如何指定特定pip 安装源?最近安装包又有问题了,如何换源呢?

2024-10-22 10:22:46 209 1

原创 如何写好提示词?

每次输入和输出的最大长度。Al一次输入有限, 就像从窗口看世界,每次只能看到一部分风景;窗口是可以滑动的,所以可以把历史消息摘要。

2024-10-16 22:34:55 387

原创 数据库加密

透明数据加密(TDE):在数据库引擎层面进行加密和解密操作,对应用程序透明,并且对大多数查询操作的影响较小。

2024-10-15 20:51:28 188

原创 cromwell 运行过程

workflow_root:运行workflow时首先创建文件夹<cromwell_root>/<workflow_uuid>,在此目录执行任务。<call_dir>:每个call 任务 调用都有自己的子目录,位于 <workflow_root>/call-<call_name>cromwell 运行。

2024-10-09 14:36:37 208

原创 singularity

【代码】singularity。

2024-10-09 08:59:40 221

原创 docker构建python R环境并更换镜像源

最近在集群搭建docker环境,拉取ubuntu镜像后,apt-get仅仅只有50几kb每秒;使用pip安装个包也是同样差不多的速度,有些体积比较大的包比如tensorflow,动辄601.3 MB,安装太慢了。

2024-09-27 11:27:15 380

原创 合并多个conda环境

【代码】合并多个conda环境。

2024-09-26 17:34:54 391

原创 python项目代码检查工具 : pre-commit

在多人参与的大型项目里,最基本的一件事就是让所有人的代码风格保持一致,整洁得就像是出自同一人之手。

2024-07-31 11:39:39 883

原创 wdl条件判定 if语法及用途

根据控制条件不同执行不同流程。根据输入数据不同执行不同流程。wdl语法——条件判定。:判断是否输入了该文件。

2024-03-07 19:56:58 569 2

原创 如何实现wdl读取两个文件设置参数,使用scatter执行任务?

如果需要读取两个文件,如何实现使用scatter执行任务?构建索引读取脚本,每次通过编号提取需要的内容。

2024-03-04 22:51:37 526

原创 docker images 镜像

docker镜像就像是类的概念,而容器相当于实例。

2024-02-24 09:21:03 431

原创 wdl脚本实战

教程:https://github.com/openwdl/wdlwdl概述:每个wdl脚本包含一个workflow,每个workflow包含多个task,通过调用task执行命令。适合于流程化的多个步骤,例如后一个步骤依赖前一个步骤的产生结果。

2024-02-07 11:50:24 719 1

原创 序列比对的几种情况记录

由于pcr偏好性导致pcr扩增中出现多条重复reads,测序结果表明多条reads比对到同一个位置。仅有一个最优比对位置的reads,因此有多个最优比对位置的reads就不是unique reads。重复率计算公式:(1-Duplication reads)/raw reads。2.sam文件中X0:1:n 标签,其中n表示共有多少个最优比对。bwa中可以指定-n 参数指定最大允许的错配数量。1.sam文件中XT:A:{} 标签,其中。

2024-01-25 18:43:52 727

原创 Lillefors正态性检验

样本量的要求:Lilliefors检验对样本量的要求相对较高,通常要求样本量大于20。当样本量较小时,Lilliefors检验的效果可能不稳定。Lilliefors检验不需要假定数据的分布类型,它基于观测数据来评估是否来自正态分布。

2024-01-25 17:30:56 714

原创 阿里云ossutil64

github地址:https://github.com/aliyun/ossutil/releases。, 依次输入需要的字段。

2023-12-11 19:10:30 302 1

原创 为什么python添加参数指令要写在if __name__==“__main__“中

提高代码的可重用性和模块化。将代码封装为一个模块时,通常会在模块中定义一些函数、类或变量,并在其他程序导入和使用。但是,有部分代码希望**在模块被导入时不执行,而只在模块作为主程序直接运行时执行。便于单元测试和调试。可以在主程序块中编写一些测试代码,用于验证模块的功能和正确性。直接运行脚本时,这些测试代码会被执行。时才会被执行,而不会在作为模块被导入时执行。条件下的主程序块中是一种常见的写法。条件下的代码块只有在当前脚本。将代码的参数指令写在if。

2023-11-29 16:00:54 160 1

原创 git基础操作

Git 有三种状态:和。这会让Git 项目拥有三个阶段:工作区、暂存区以及 Git 目录。: 添加快照:对已经存在暂存区的文件进行暂存+提交首先进行git add,之后才能进行git commitgit diff:显示已在暂存区及工作区的差异。

2023-11-29 15:29:23 75 1

原创 illumina测序原理

Sequencing by Synthesis(边合成边测序)

2023-11-29 09:34:27 393 1

原创 类的初始化,方法及特殊方法

特殊方法,当对象被初始化时就会被调用,形参和类的属性名称通常相同;虽然在程序运行中都可以在对象中添加属性,但是为了不容易出现错误,:在类中定义的函数,方法的第一个形参通常是。:内置函数,判断实例是否属于某个类。,实现两个类的相加及类+整数功能。,能够在Time类上使用。函数,便于初始化和调试。,调用该方法实现打印时间。:打印对象时调用并输出。,实现对于两个类的相加。一般写对象的时候先写。

2023-11-29 09:27:08 119 1

原创 Git 相关操作

Git 有三种状态:和。这会让Git 项目拥有三个阶段:工作区、暂存区以及 Git 目录。: 添加快照:对已经存在暂存区的文件进行暂存+提交首先进行git add,之后才能进行git commitgit diff:显示已在暂存区及工作区的差异。

2023-11-27 18:11:25 43 1

原创 已经修改了目录权限为什么其他账户还是不能访问?

5 = 4 + 1 读和运行权限。4 = 4 只读权限。7 = 4 + 2 + 1 读写运行权限。的权限限制,导致不能访问子目录。权限,为什么登录其他账户。原因:因为上一级目录。

2023-11-27 15:17:13 262 1

原创 Lillefors正态性检验

Lilliefors检验对样本量的要求相对较高,通常要求样本量大于20。当样本量较小时,Lilliefors检验的效果可能不稳定。Lilliefors检验不需要假定数据的分布类型,它基于观测数据来评估是否来自正态分布。

2023-11-23 17:19:38 340

原创 linux简单又实用的神器screen

下文介绍针对screen命令集,对应的: - 状态介绍 - 基础命令 - 高级命令。

2023-10-17 10:01:32 72

原创 使用seqkit统计fastq.gz文件行数

主要是一个操作fastq文件的生信软件。

2023-09-28 16:44:18 614 1

原创 vim实用技巧:复制及查看格式

yy + p在光标的位置按“yy”,复制当前行;然后再光标的行按“p”,粘贴到下一行,原来的往下顺移。复制多行----------nyy(比如3yy,复制3行)复制多遍----------np。

2023-09-25 10:13:52 553 1

原创 shell find 指令及实用场景

find指令在shell编程中用的很多。

2023-09-24 22:53:13 338 1

原创 VCF文件详细解释及操作方法

以为开头**第1列:**CHROM-变异发生的染色体名称。**第2列:**POS-变异发生的染色体上的位置。**第3列:**ID-variant的ID,对应dbSNP数据库中的ID,若没有,则默认使用‘.’**第4列:**REF-参考基因组上的碱基。:ALT:变异碱基或碱基序列。:QUAL-变异的质量值,表示变异的可信度。**第7列:**FILTER 变异的过滤状态,表示是否通过了质量控制。**第8列:**INFO 变异的附加信息,如变异类型、深度、基因功能等。

2023-09-18 14:04:33 1446 1

原创 SEG相关指令及自己踩的坑

Sun Grid Engine (SGE):需要有大量任务执行,并且,解决了需要运行很多任务,但是运行任务过多可能导致内存不足,线程占用过多等问题,从而导致了任务处理不是最有效的方法。

2023-09-06 10:42:44 798 1

原创 python 字典数据结构

字典是python最好的语言特性之一,是很多高效算法的基本构建块。

2023-09-01 13:44:42 205 1

原创 kegg Error in clusterProfiler:::kegg_list(“pathway“, species): unused argument (species)

cluserProfile包更新失败。

2023-04-19 15:41:20 1010 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除