- 博客(33)
- 收藏
- 关注
原创 R ggplot2 绘图细节 geom_text展示不全 y轴坐标细节 x轴标题
geom_text()展示不全,很有可能是y轴过于短,导致上下没有间隙。会使得y轴的坐标轴上限又变成100,图片展示又不全,非常坑。如果修改代码 ,使用ylim()就可以修复。
2024-11-21 18:02:49
383
原创 修正Z-score检验异常值
‒ 使用MAD(中位数绝对偏差)而不是标准差,这样对异常值更稳健;传统Z-score由于计算样本标准差,容易收到异常数值影响。Z-score主要衡量均值差异,要求数据符合正太分布,且容易收到异常值影响。异常阈值设置:对于较大的数据集,阈值通常设置为3,较小数据集可以修正为2。计算公式:z = (x - mean) / std。‒ 适合非正态分布的数据。
2024-11-05 18:09:22
512
原创 pip配置及换源
修改哪一个config比较好?如果有site层级,直接修改sit层级就ok。每个pip根据不同层级分别调用、更新不同config策略。linux上有多个pip,如何指定特定pip 安装源?最近安装包又有问题了,如何换源呢?
2024-10-22 10:22:46
209
1
原创 如何写好提示词?
每次输入和输出的最大长度。Al一次输入有限, 就像从窗口看世界,每次只能看到一部分风景;窗口是可以滑动的,所以可以把历史消息摘要。
2024-10-16 22:34:55
387
原创 cromwell 运行过程
workflow_root:运行workflow时首先创建文件夹<cromwell_root>/<workflow_uuid>,在此目录执行任务。<call_dir>:每个call 任务 调用都有自己的子目录,位于 <workflow_root>/call-<call_name>cromwell 运行。
2024-10-09 14:36:37
208
原创 docker构建python R环境并更换镜像源
最近在集群搭建docker环境,拉取ubuntu镜像后,apt-get仅仅只有50几kb每秒;使用pip安装个包也是同样差不多的速度,有些体积比较大的包比如tensorflow,动辄601.3 MB,安装太慢了。
2024-09-27 11:27:15
380
原创 python项目代码检查工具 : pre-commit
在多人参与的大型项目里,最基本的一件事就是让所有人的代码风格保持一致,整洁得就像是出自同一人之手。
2024-07-31 11:39:39
883
原创 如何实现wdl读取两个文件设置参数,使用scatter执行任务?
如果需要读取两个文件,如何实现使用scatter执行任务?构建索引读取脚本,每次通过编号提取需要的内容。
2024-03-04 22:51:37
526
原创 wdl脚本实战
教程:https://github.com/openwdl/wdlwdl概述:每个wdl脚本包含一个workflow,每个workflow包含多个task,通过调用task执行命令。适合于流程化的多个步骤,例如后一个步骤依赖前一个步骤的产生结果。
2024-02-07 11:50:24
719
1
原创 序列比对的几种情况记录
由于pcr偏好性导致pcr扩增中出现多条重复reads,测序结果表明多条reads比对到同一个位置。仅有一个最优比对位置的reads,因此有多个最优比对位置的reads就不是unique reads。重复率计算公式:(1-Duplication reads)/raw reads。2.sam文件中X0:1:n 标签,其中n表示共有多少个最优比对。bwa中可以指定-n 参数指定最大允许的错配数量。1.sam文件中XT:A:{} 标签,其中。
2024-01-25 18:43:52
727
原创 Lillefors正态性检验
样本量的要求:Lilliefors检验对样本量的要求相对较高,通常要求样本量大于20。当样本量较小时,Lilliefors检验的效果可能不稳定。Lilliefors检验不需要假定数据的分布类型,它基于观测数据来评估是否来自正态分布。
2024-01-25 17:30:56
714
原创 阿里云ossutil64
github地址:https://github.com/aliyun/ossutil/releases。, 依次输入需要的字段。
2023-12-11 19:10:30
302
1
原创 为什么python添加参数指令要写在if __name__==“__main__“中
提高代码的可重用性和模块化。将代码封装为一个模块时,通常会在模块中定义一些函数、类或变量,并在其他程序导入和使用。但是,有部分代码希望**在模块被导入时不执行,而只在模块作为主程序直接运行时执行。便于单元测试和调试。可以在主程序块中编写一些测试代码,用于验证模块的功能和正确性。直接运行脚本时,这些测试代码会被执行。时才会被执行,而不会在作为模块被导入时执行。条件下的主程序块中是一种常见的写法。条件下的代码块只有在当前脚本。将代码的参数指令写在if。
2023-11-29 16:00:54
160
1
原创 git基础操作
Git 有三种状态:和。这会让Git 项目拥有三个阶段:工作区、暂存区以及 Git 目录。: 添加快照:对已经存在暂存区的文件进行暂存+提交首先进行git add,之后才能进行git commitgit diff:显示已在暂存区及工作区的差异。
2023-11-29 15:29:23
75
1
原创 类的初始化,方法及特殊方法
特殊方法,当对象被初始化时就会被调用,形参和类的属性名称通常相同;虽然在程序运行中都可以在对象中添加属性,但是为了不容易出现错误,:在类中定义的函数,方法的第一个形参通常是。:内置函数,判断实例是否属于某个类。,实现两个类的相加及类+整数功能。,能够在Time类上使用。函数,便于初始化和调试。,调用该方法实现打印时间。:打印对象时调用并输出。,实现对于两个类的相加。一般写对象的时候先写。
2023-11-29 09:27:08
119
1
原创 Git 相关操作
Git 有三种状态:和。这会让Git 项目拥有三个阶段:工作区、暂存区以及 Git 目录。: 添加快照:对已经存在暂存区的文件进行暂存+提交首先进行git add,之后才能进行git commitgit diff:显示已在暂存区及工作区的差异。
2023-11-27 18:11:25
43
1
原创 已经修改了目录权限为什么其他账户还是不能访问?
5 = 4 + 1 读和运行权限。4 = 4 只读权限。7 = 4 + 2 + 1 读写运行权限。的权限限制,导致不能访问子目录。权限,为什么登录其他账户。原因:因为上一级目录。
2023-11-27 15:17:13
262
1
原创 Lillefors正态性检验
Lilliefors检验对样本量的要求相对较高,通常要求样本量大于20。当样本量较小时,Lilliefors检验的效果可能不稳定。Lilliefors检验不需要假定数据的分布类型,它基于观测数据来评估是否来自正态分布。
2023-11-23 17:19:38
340
原创 vim实用技巧:复制及查看格式
yy + p在光标的位置按“yy”,复制当前行;然后再光标的行按“p”,粘贴到下一行,原来的往下顺移。复制多行----------nyy(比如3yy,复制3行)复制多遍----------np。
2023-09-25 10:13:52
553
1
原创 VCF文件详细解释及操作方法
以为开头**第1列:**CHROM-变异发生的染色体名称。**第2列:**POS-变异发生的染色体上的位置。**第3列:**ID-variant的ID,对应dbSNP数据库中的ID,若没有,则默认使用‘.’**第4列:**REF-参考基因组上的碱基。:ALT:变异碱基或碱基序列。:QUAL-变异的质量值,表示变异的可信度。**第7列:**FILTER 变异的过滤状态,表示是否通过了质量控制。**第8列:**INFO 变异的附加信息,如变异类型、深度、基因功能等。
2023-09-18 14:04:33
1446
1
原创 SEG相关指令及自己踩的坑
Sun Grid Engine (SGE):需要有大量任务执行,并且,解决了需要运行很多任务,但是运行任务过多可能导致内存不足,线程占用过多等问题,从而导致了任务处理不是最有效的方法。
2023-09-06 10:42:44
798
1
原创 kegg Error in clusterProfiler:::kegg_list(“pathway“, species): unused argument (species)
cluserProfile包更新失败。
2023-04-19 15:41:20
1010
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人