- 博客(37)
- 资源 (1)
- 收藏
- 关注
原创 一个画多个bed文件venn图的好工具
一个画venn图的好工具;https://intervene.readthedocs.io/en/latest/如果你有多个bed文件,想看overlap的venn图,这个工具可以很方便的使用;注意指定参数的过程中bedtools options f 与F的差别,以及是否要使用更严格的参数 r....
2021-03-19 10:36:25
1072
1
原创 bioinformatics 杂志list
一个 很好的投稿参考,生信杂志信息网页http://bioinfolab.miamioh.edu/bioinfolab/journals.php
2020-04-22 11:50:30
694
原创 一个比较好用的RNA seq在线分析工具iDEP
iDEP 是一个比较好用的在线RNAseq分析工具,上传raw counts 文件可以输出heatmap, pca等,还可以做target 预测,功能强大http://bioinformatics.sdstate.edu/idep/https://bmcbioinformatics.biomedcentral.com/track/pdf/10.1186/s12859-018-2486-6...
2020-04-22 11:48:03
6415
原创 grep -rn 查找及批量替换
grep -rn可以关键词查找符合条件的文件的行;去重文件名,然后xargs替换模式grep -rn "xxx" . |cut -d ':' -f 1 |sort |uniq |xargs sed -i 's/xxx /yyy/g'
2019-10-11 11:09:34
14499
原创 /lib/ld-linux.so.2: bad ELF interpreter
原因是64位系统使用了32位的软件,解决方法网上有很多就是重新安装 glibc的i686 ,然后export LD_LIBRARY_PATH;不过这个用一次就会无效;查询其它网页发现root安装这个时候有个依赖也会一同安装:nss-softokn-freebl 的i686版本同样安装后 export,然后就可以生效了普通用户安装rpm2cpio xxx....
2019-10-10 09:05:26
216
原创 awk 多条件判断
awk '{if (NR==2){print $0/4}else if(NR==4){print $0/4} else {print}}' xxx.txt
2019-10-09 13:12:13
10953
原创 dos2unix
大早上发现自己的程序挂了,然后捣鼓半天发现脚本的格式不对,然后喘一口气,来个格式转换将当前路径下的所以的文件都变为unix格式find . -name "*" | xargs dos2unix...
2019-09-28 10:45:41
249
原创 Fst, pi, TajimaD plink 计算
Fst, pi, TajimaD 计算首先使用vcftools 计算出来各个各个值vcftools --vcf test.vcf--window-pi 3000--out testvcftools --vcf test.vcf--TajimaD 3000--out testvcftools --vcf test.vcf --weir-fst-pop p1.tx...
2019-09-21 09:34:19
11440
原创 GWAS 分析Fst画图
GWAS 分析 Fsthttps://rpubs.com/rossibarra/61700 有详尽的步骤可以参考画图PS 当然这个网站 https://rpubs.com/ 也有很多很好的参考资料
2019-08-22 09:49:44
5429
原创 awk NR==FNR用法小记录
1. awk a[$1]=, 可以写你好几个值,不一定非得是$0,连接的话直接中间双引号,写分割符2. 注意指定-F'\t',否则生成的结果中单个field中的空格可能变成了\t,造成列的混乱;awk -F'\t' 'NR==FNR{a[$1]=$1"\t"$2}NR>FNR{if(a[$1]){print a[$1],$0}else{print "NA",$0}}'...
2019-08-15 09:46:19
515
原创 从VCF文件画PCA图
1. 使用plink 获取SNP_test.eigenvec 文件plink --maf 0.05 --allow-extra-chr --vcf SNP.vcf --pca header tabs -out SNP_testeigenvec 文件格式如下:FID IID PC1 PC2 PC3 PC4F2 H -0.101378 -...
2019-08-14 17:29:16
4486
1
翻译 conda 删除环境
conda removeremoves a package from an environment. To remove the environment you need to useconda env remove -n test_env
2019-08-05 14:43:19
20948
翻译 R facets (ggplot2)小练习
主要参考如下网址:http://www.cookbook-r.com/Graphs/Facets_(ggplot2)/library(ggplot2)p <- ggplot(mtcars, aes(mpg, wt)) + geom_point()# With one variablep + facet_grid(. ~ cyl, scales = "fixed")p +...
2019-07-28 09:35:28
290
转载 一个比较好的 population genetics 分析的网页内容(PCA分析,Fst。。。)
https://angus.readthedocs.io/en/2016/pop_gen_tutorial.html
2019-07-21 11:01:49
1377
翻译 R qtl package 使用记录
1. qtl安装了很多次,提示R版本不符合;重启了R,安装成功2. 画出的图如下,更详细的linkage map 图需要借助其它软件########################install.packages("qtl")library(qtl)source("https://bioconductor.org/biocLite.R")install.pack...
2019-07-15 10:36:59
2310
翻译 package is not available (for R version XXX)
install.packages('package_name', dependencies=TRUE, repos='http://cran.rstudio.com/')R 安装包的提示 错误,常用的是添加repo:https://www.haktansuren.com/installing-r-package-fixing-package-xxx-is-not-available-fo...
2019-07-12 15:36:47
9021
1
转载 一个GWAS 分析的简易练习
最近在测试GWAS流程,从网上看了一些资料,发现了一个简易的教程:https://angus.readthedocs.io/en/2017/GWAS.html#从下载数据,到画出曼哈顿图,另外其实没有太理解R脚本中的参数传递方法,还有简书里面的qqman,画曼哈顿图可以标记出特定的位点参考链接:https://www.jianshu.com/p/e914ecb99fcch...
2019-06-27 10:33:09
2119
原创 rename 用法,批量修改文件名
1. rename expression pattern file (三个参数)假如有以下文件1_R1.fq2_R1.fq3_R1.fq4_R1.fq######################rename _R . *fq执行该命令后1.1.fq2.1.fq3.1.fq4.1.fq...
2019-06-20 11:50:02
3446
原创 perl lookup issue 解决
1. 折腾了大半天:首先重新 编译安装Perl,使其支持多线程: 2.tar vxf perl-5.22.0.tar.bz23 cd perl-5.22.04 ./Configure -des -Dprefix=~/.plenv/versions/5.22.0 -Dusethreads -Uinstalluserbinperl -Dcc=gcc5 make6 make inst...
2019-05-30 14:53:23
154
原创 仿GWAS曼哈顿图
1. 根据vcf文件获取一个类似曼哈顿图的input文件,只是第4列的p value 值变为了区间的snp number如下:SNP CHR BP P1 chr1 100000 13622 chr1 110000 13193 chr1 120000 13214 chr1 1300...
2019-05-21 16:35:54
1596
原创 ggplot2 添加圈和pca3d 小笔记
1 ellipse .library("ggplot2")mtcars$cyl <- as.factor(mtcars$cyl)head(mtcars)ggplot(faithful,aes(waiting, eruptions)) + geom_point() + stat_ellipse()p <- ggplot(faithful,aes(waiting, erupti...
2019-05-12 14:22:17
3231
转载 转载hisat用法
有感于自己的记性,还是转载一下分析小鼠转录组数据的参考,主要是用hisat分析,包含有小鼠基因组及索引文件的下载。https://www.jianshu.com/p/479c7b576e6f...
2019-04-24 23:44:13
1169
原创 Rscript 运行could not find function "getGeneric" 解决方法
1. 使用R脚本featurecounts分析时提示以上的错误运行命令: /usr/bin/Rscript run-featurecounts.R XXX####################################R 脚本的前几行:library(Rsubread)library(limma)library(edgeR)#############...
2019-04-22 20:16:45
3491
原创 hg38 resource bundle google cloud download links
https://software.broadinstitute.org/gatk/download/bundle通过GATK的resource bundle 下载hg38数据总是提示超过最大连接数(FileZilla)搭上梯子去Google cloud 存储里,查找到这些文件的下载地址,不过还是需要能外网才能下载到,让我又怀念以前的VPN了https://console.cloud...
2019-04-11 00:55:49
2271
2
原创 imputation in genetics 小笔记
1. 来自wiki的定义如下:Imputation in genetics refers to the statistical inference of unobserved genotypes.[1] It is achieved by using known haplotypes in a population, for instance from the HapMap or the 10...
2019-01-28 19:52:26
705
2
原创 网页爬虫 小笔记
# -*- coding: UTF-8 -*-import requestsfrom lxml import etreeimport sysdef getOnePage(n): url = f'https://maoyan.com/board/6?offset={n}' header = {'User-Agent': 'Mozilla/5.0 (Windows...
2019-01-28 15:50:29
153
原创 干细胞 通路 小笔记
1. http://www.sinobiological.com/stem-cell-signaling-pathways-r0568.html 主要是 hedgehog Signaling Pathway ; Notch Signaling Pathway; TGF-beta Pathway; Wnt Signaling Pathway以及相应产品的蛋白质,抗体,CDNA clone,E...
2019-01-27 15:08:51
199
原创 质谱流式细胞技术 小笔记
1. 一篇文章关于 mass cytometry 的文章A Continuous Molecular Roadmap to iPSC Reprogramming through Progression Analysis of Single-Cell Mass CytometryEli https://www.cytobank.org/ 2. http://www.sohu.c...
2019-01-21 19:56:12
3312
原创 干细胞相关的数据库 小笔记
大部分还是转录组数据,可供查询,HipSci 数据可以下载。 StemMapper Gene expression data http://stemmapper.sysbiolab.eu/ ESCD CHIP seq & Expression data https:/...
2019-01-19 17:31:54
1284
原创 冠心病与心肌梗死的区别 小笔记
1. Is Coronary Atherosclerosis One Disease or Many? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5395046/ Perhaps CAD patients, currently lumped together in the guidelines and minds of clinician...
2019-01-18 16:53:08
372
原创 一篇关于computational biologist 的文章
最近感觉有些电量低,使用computational biology skills Google搜索,搜到了一篇文章,感觉还不错,Mark一下http://users.umiacs.umd.edu/~sridhar/Docs/Loman-CompBiol.pdf
2019-01-15 19:10:00
206
原创 批量下载gnomad数据的hg19版本文件
cat list|xargs -i echo "wget -c http://hgdownload.cse.ucsc.edu/gbdb/hg19/gnomAD/vcf/{} > {}.log 2>&1 &" |sh(cat list |xargs -i echo "wget -c {} >> test.log 2>&1 &"|
2019-01-14 11:55:09
2101
原创 GATK Somatic 流程学习1
1. 主要是参考链接https://software.broadinstitute.org/gatk/documentation/article?id=9183#1 的步骤,阅读了解相应的介绍2. https://console.cloud.google.com/storage/browser/gatk-best-practices/somatic-b37/?project=broad-dsd...
2019-01-11 16:46:31
874
原创 最近看到的一些感觉有用的网站(gene list 、gene-gene graph)
http://manual.graphspace.org/projects/graphspace-python/en/latest/demos/gene-gene-graph.html http://www.whichgenes.org/ https://www.snip2code.com/Access/Landinghttps://www.ncbi.nlm.nih.gov/...
2019-01-02 11:17:34
1497
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人