- 博客(138)
- 收藏
- 关注
原创 purge_dups
尽管可以通过runner程序调用,但喜欢自己写脚本,因此不安装python3和runner。purge_dups是用C语言编写,因此需要通过make来编译。脚本在scripts目录下,编译的程序在bin目录下。
2024-07-28 15:18:48
910
原创 Pooling Sequencing
BSA(Bulked segregation analysis)即混合分组分析,也称分离群体分组分析,是指利用目标性状存在极端表型差异的两个亲本构建分离群体,在子代分离群体中,选取两组表型差异极端的个体分别构建混合池 ,结合高通量测序技术对混合样本测序,比较两组群体在多态位点(SNP)的等位基因频率(AF)是否具有显著差异,定位与目标性状相关联的位点并对其进行注释,研究控制目标性状的基因及其分子机制。相较于传统的遗传学研究方法(基因定位常用分析方法,小编已经安排上啦!
2024-05-29 15:31:10
1438
原创 【群体遗传学】 notes
随着遗传学的进步,对正选择的概念也有了更深的理解。②单向式选择:发生在环境条件朝一定方向变化的情况下,某一极端的个体被保存,另一极端的个体被淘汰,使种群中某等位基因频率逐代增加,而相对的等位基因频率则逐代减少,结果整个群体朝着一定方向变化。3)值得注意的是,基因漂变对于种群非常小的物种的基因型的频率的影响是很大的。基因漂移(genetic drift)实际上就是由于时间的变化和特定的随机事件,一个生物族群的某个特定的等位基因的频率(frequency)相较于其他族群的特定的等位基因的频率产生的变化。
2024-02-23 13:41:34
1235
原创 【Genetic Drift】
Genetic drift is a change in allele frequency in a population, due to a random selection of certain genes. Oftentimes, mutations within the DNA can have no effect on the fitness of an organism. These changes in genetics can increase or decrease in a popula
2024-02-23 13:35:49
789
原创 sed(多行)替换/删除所有换行符(变一行)
语法解释:sed是按行处理文本数据的,每次处理一行数据后,都会在行尾自动添加trailing newline,其实就是行的分隔符即换行符。连续两行执行一次sed命令,这样就可以把前一行的\n替换完成。(Ps:执行一次命令其实就是数据两两去除了中间的\n而已)语法解释:前边加上(:a;sed “s/要匹配的字符串/要替换成的字符串/g” test.gson。sed -i “s/拆分符/拆分符\n/g” test.gson。语法解释:匹配拆分符,换成拆分符+换行符即实现换行。
2023-10-10 23:30:50
2777
原创 【基因组可视化工具】 数百个 大全
github:https://github.com/cmdcolin/awesome-genome-visualizationweb:https://cmdcolin.github.io/awesome-genome-visualization/?latest=trueA list of interesting genome visualizers, genome browsers, orgenome-browser-like implementationsSee the new companion
2023-07-27 10:06:38
872
原创 blast的-max_target_seqs?
之前大部分人都将这个参数的值设置为1,认为会输出最优匹配的一条,但是作者验证后发现,这是一个错误的用法,它输出的并不是最优匹配的一条结果,而是第一条较好的匹配结果;对于相同的比对任务,使用不同版本的数据库时,即使所有版本都包含相同的最佳匹配结果,但是BLAST却返回不同的结果。该“bug”就是:-max_target_seqs参数返回的不过是前N个符合给定的E值的hit,而并不一定保证就是E值最低的N个hits。测试发现,blast没有哪个参数可以返回最优匹配的结果,最好的方式就是通过脚本过滤筛选!
2023-04-25 10:41:53
1302
原创 linux 记录
awk 分隔符awk默认分割符是空格。awk的分隔符还分为两种,“输入分隔符” 和 “输出分隔符” 。(1)输入分隔符:英文原文field separator,简称FS。默认空白字符(即空格),awk默认以空白字符为分隔符对每一行进行分割。内置变量FS,使用-v选项。awk -v FS='\t' '{}' file (2)输出分割符:英文原文output field separator,简称OFS。Linux ifref: https://blog.youkuaiyun.com/m0_50668851/
2022-05-05 19:56:55
435
原创 bam 行删除
https://blog.youkuaiyun.com/liangbilin/article/details/108977163samtools view -H test.bam | sed -e ‘s/SN:([0-9XY])/SN:chr\1/’ -e ‘s/SN:MT/SN:chrM/’ | samtools reheader - test.bam > test.CHR.bam报错采用 转sam 删除samtools view *.bam -O SAM > *.samsed再转bam报
2022-04-28 16:27:09
826
原创 合并fq文件
多个lane fastq.gz 文件cat L1.R1.fastq.gz L2.R2.fastq.gz > sample.R1.fastq.gz
2022-02-22 20:32:38
2452
转载 Linux脚本传递参数
一、Shell 特殊参数解释首先来看几个特殊变量:$0, $#, $*, $@, $?, $$, $_#!/bin/bashecho $0 # 当前脚本的文件名(间接运行时还包括绝对路径)。echo $n # 传递给脚本或函数的参数。n 是一个数字,表示第几个参数。例如,第一个参数是 $1 。echo $# # 传递给脚本或函数的参数个数。echo $* # 传递给脚本或函数的所有参数。echo $@ # 传递给脚本或函数的所有参数。被双引号 (" ") 包含时,
2022-02-10 16:05:06
4529
原创 如何解决Excel分数变成日期
https://jingyan.baidu.com/article/e4d08ffd91b32b0fd2f60dec.html当在excel单元格输入分数时,如果是分子或分数刚好适合是月日的,会自动变成日期格式,比如,在B13单元格输入2/3,光标跳到另一个单元格时(按下回车键),B13单元格会自动变成2月3日。直接把单元格设置为文本格式的。要注意的是,要先把单元格设置为文本格式后再输入分数。(先把目标列设置为文本再粘贴或者输入)如果先输入分数再设置单元格为文本格式的话,单元格内容变成了数字。
2022-02-09 14:30:15
3270
原创 Linux注释
单行#多行使用 :<<! !:<<!fileContent=`cat $filename`i=0for line in $fileContentdo fileList[$i]=$line ((++i))done!使用语句 if false then fiif falsethen echo "1:" echo "2:" echo "3:"fi
2022-02-08 16:27:52
912
原创 Linux删除 指定数目行【或者所有行】删除光标到行首
转到文件结尾G转到第9行9G删除所有内容(先用G转到文件尾),使用::1,.d删除第9行到第200行的内容(先用200G转到第200行),使用:9,.d删除说明:vi中,“.”当前行,“1,.”表示从第一行到当前行,“d”删除...
2022-02-08 13:41:53
2010
原创 DAVID-GO-记录
https://david.ncifcrf.gov/home.jsp2. upload data3. analysis4. results5. plotbarplot(data,showCategory = 15,title = "test")
2021-12-20 14:00:58
444
原创 R - history
改变x坐标方向+theme(axis.text.x = element_text(angle = 45, hjust = 0.5, vjust = 0.5))
2021-12-19 15:34:29
219
原创 MSU转Uniprot转Entrez ID
PlantGSEADAVID注意是Uniprot ACCESSION还是Uniprot ID网站:https://david.ncifcrf.gov/并打开Gene ID Conversion12Submit34 再点击ID conversion5 选择ENTREZ ID6
2021-12-17 09:15:28
1116
原创 未比对上的bam reads 处理
查看bam文件 flags 4代表read未比对上;samtools view -f 4 *bam|less -S提取提取unmapped序列:samtools view -b -h -f 4 *.bam > unmapped.bam-h 文件包含header line;-f,提取;-b,输出为bam格式###-F参数是过滤的意思(filter);类似grep -vsamtools view -b -h -F 4 *.bam > mapped.bamF意思为过滤掉以4为标签的序
2021-12-06 21:19:56
3340
原创 Linux 【kill】 【stop】 【continue】 job
Kill All Stopped Jobs LinuxShow jobs with PIDjobs -lHow to Bring Background Job to Foregroundfg %1Jobs Command Options-n – This shows the jobs that have changed their status since the last notification. For example, a job that has changed from a ru
2021-11-21 10:10:20
2297
原创 RNAseq-GO、biomaRt转换ID
O.Sativa选用MSU或者RAPDB这两个数据库的genome和gtf文件,介绍一下MSU的ID,RAPDB的同理。The Rice Annotation Project (RAP)(https://rapdb.dna.affrc.go.jp/index.html)和Rice Genome Annotation Project (RGAP7,MSU)(http://rice.plantbiology.msu.edu/index.shtml)RAP格式为“Os-Chr-g-number”,MSU格式为“L
2021-11-18 17:21:03
4765
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人