- 博客(46)
- 资源 (6)
- 问答 (1)
- 收藏
- 关注
原创 conda环境的移植
**移植conda环境**如果想移植自己Conda的环境或者其它人的conda环境,1.查看当前conda所有的环境source activate # 激活base环境。如果是移植其它人的环境,则激活其它人conda环境./conda info --envs # 查看所有环境。如果是查看其它人的conda环境,需要写他人conda的绝对路径2.进入所要移植的环境source sciclone # 进入sciclone 环境 。如果是移植base环境,则在base环境3.导出当前环
2022-05-11 17:44:30
6208
原创 RNA检测流程
1 比对Hist2 下载https://github.com/DaehwanKimLab/hisat2./hisat2/hisat2-2.2.1/hisat2 \ -x /hg19index/ucsc.hg19 \ -1 fq1.gz \ -2 fq2.gz \ -S out.sam \ --dta --rna-strandness-x :对hg19参考基因组做的索引cd hg19indexhisat2/hisat2-2.2.1/hisat2-build -p 4 ucsc.
2022-04-19 14:44:36
2291
原创 matplotlib笔记
设置画布plt.figure(figsize=(25, 6))1. 轴标签修改设置x轴,y轴 最大,最小 范围plt.ylim(-20, 20)plt.xlim(-20, 20)修改x轴刻度, 只显示在 x_kedu 位置的标签 ,标签对应为x_label ,rotation表示标签旋转50度x_kedu = [3,5,7]x_label = ["exon3","exon5","exon7"]plt.xticks(x_kedu, labels=x_label,rotation=50
2022-04-15 11:53:09
540
转载 pymc3 MCMC应用【转载】
转载:https://blog.youkuaiyun.com/qq_44009891/article/details/106069563第一部分 编程准备贝叶斯思维:和更传统的统计推断不同,贝叶斯推断会保留不确定性,在贝叶斯派的世界观中,概率是被解释为我们对一件事情发生的相信程度或者说信心(飞机事故,总统选举)。需注意的是,我们每个人都可以给事件赋概率值,而不是存在某个唯一的概率值,因为不同的人拥有不同的信息,因此他们对同一事件发生的信心也可以有不同的值,但这些不同并不说明其他人是错误的。飞机事故:综合某航空
2022-03-24 23:59:21
1016
转载 Python 读取gz文件,字符串与字节串的相互转换
首先是字节串转字符串,也就是str:b = b'some byte array' str(b, encoding = "utf-8") #orbytes.decode(b)然后是字符串转为字节串:s = 'some string' bytes(s, encoding = "utf8") #orstr.encode(s)
2022-03-04 18:05:51
966
原创 bam文件中所有 tags的解释
bam文件中所有 tags的解释官方的解释文档http://samtools.github.io/hts-specs/SAMv1.pdfTags 的详细解释http://samtools.github.io/hts-specs/SAMtags.pdf
2021-11-25 19:09:22
1224
原创 linux R安装 , libcurl >= 7.22.0报错
目录R下载安装R官网:选择清华镜像选择最新版本或以往版本选择版本安装R下载安装R官网:https://www.r-project.org/选择清华镜像选择最新版本或以往版本选择版本安装wget https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/base/R-3/R-3.6.1.tar.gztar zxvf R-3.6.1.tar.gzcd R-3.6.1./configure --prefix="当前的安装目录"可能遇到的报错:c
2021-05-13 18:40:08
3527
原创 python matplotlib画图中文显示
matplotlib 中文显示1. 查看字体路径2. 删除matplotlib的缓冲目录3. 修改matplotlibrc文件4. 最后使用jupyterlab的话,重启1. 查看字体路径import matplotlib print(matplotlib.matplotlib_fname())把 ttf 格式的中文字体文件放到path_to/python3.8/site-packages/matplotlib/mpl-data/fonts/ttf2. 删除matplotlib的缓
2021-04-23 14:26:37
310
1
原创 ensembl数据库BioMart使用,查找转录本ID在ensembl与refseq中的对应关系
如何查找 转录本ID在ensembl与refseq中的对应关系Ensembl数据库地址:http://grch37.ensembl.org/index.html进入BioMart选择DataSet点击左侧 Filter 可以选择一些条件点击Attributes点击GENE选择特征 ,勾选 Gene name , Transcript name点击EXTERNAL, 在 External References 中选择需要转换对应的外部数据库的种类信息,勾选 Refseq的转录本ID
2021-04-20 19:43:32
5578
原创 提取目标区域的bam文件,拆分bed文件,bed区间深度
提取bed区间内的readssamtools view -bh -L target.bed bamfile.bam > target.bamsamtools view -hb chr:start-end bamfile.bam > target.bam
2021-04-15 17:56:38
7126
5
原创 Git基础使用
创建服务器公钥ssh-keygen三次回车继续,生成的公钥路径在根目录下.ssh目录id_rsa.pub中。复制公钥,粘贴进gitlabGit全局设置git config --global user.name "XiaoZhang"git config --global user.email "XiaoZhang@123.com"创建gitlab远程库1.2.3.创建本地仓库,推送拉取文件mkdir MyFirstPjcd MyFirstPj'''# 初始化本地仓库
2021-04-08 19:10:03
108
原创 pandas笔记
import pandas as pddata = pd.read_csv("Narrativedata.csv")显示数据框信息data.info()2. 填充缺失值 fillnadata["Age"] = data["Age"].fillna(data["Age"].mean())3.删除缺失值 data = data.dropna()4 某一列去重 labels = data["Embarked"].unique().tolist()5. 对某一列执行 la
2021-03-18 23:23:38
4288
转载 MSI基础
MSI基础http://www.360doc.com/content/17/0515/02/39750415_654001965.shtml
2021-03-10 18:24:19
182
原创 matplotlib 画图笔记 直方图; 插入片段insertsize分布
import pysamimport numpy as npfrom matplotlib import pyplot as pltfrom matplotlib.backends.backend_pdf import PdfPagesimport globimport multiprocessing as mpdef insertSize(bam): sam = pysam.AlignmentFile(bam) insize_list = [] for read i
2021-02-07 17:34:14
1424
2
原创 matplotlib 画图笔记 柱状图、曲线图、box图
import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.backends.backend_pdf import PdfPagesimport pandas as pdGCcounttxt 文件,5列,“chrom”,“start”,“end”,“区间内gc比例”,“reads”bed文件画柱状图,曲线图,以及注释def draw_pic(GCcounttxt): # GCcounttxt 5列,"chrom","
2021-02-07 17:14:14
506
1
原创 计算bed区间gc含量,碱基深度等
计算样本 bed区间内gc ,depthimport pysamimport numpy as npimport pandas as pdimport mathimport pyfaidxdef calGC(bamfile, bed): sampleid = bamfile.strip().split("/")[-1].split(".")[0] out = open("%s.GCcount.txt"%sampleid,"w") sam = pysam.AlignmentFile(ba
2021-02-05 17:27:39
1756
原创 非root权限GCC安装
查看当前gcc版本gcc --version下载gccwget ftp.gnu.org/gnu/gcc/gcc-7.3.0/gcc-7.3.0.tar.gz解压tar -zxvf gcc-7.3.0.tar.gz进入目录cd gcc-7.3.0检测和安装相关依赖包,直接执行gcc自带的文件./contrib/download_prerequisites创建安装目录mkdir buildcd build配置文件,非root权限时设置个人安装路径, prefix 为个人安装
2021-01-26 16:47:10
824
转载 bam文件格式解析
http://blog.youkuaiyun.com/qq_21478261/article/details/106005482
2020-09-23 14:27:45
1455
翻译 深度剖析somatic CNV变异分析影响因素
深度剖析somatic CNV变异分析影响因素http://47.94.226.79/?p=1033肿瘤样本拷贝数变异分析升级啦!升级啦!升级啦!重要的事情说三遍。Control-FREEC开启新功能,可以更加准确筛选somatic CNV和LOH。先看图再说话。图1 Control-FREEC[1,2]软件分析somatic CNV设置纯度参数前(上)后(下)我们在利用Control-FREEC软件分析somatic CNV时,开启了肿瘤纯度参数后更准确的检出肿瘤样本中的CNV和LOH变化。图中
2020-09-23 11:07:03
3973
原创 ANNOVAR注释
1.下载需要科研机构邮箱#http://download.openbioinformatics.org/annovar_download_form.phptar xvfz annovar.latest.tar.gz下载数据库perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar refGene /humandb...
2020-06-14 16:25:21
3546
原创 不同参考基因组版本间 bed vcf文件转换
1. 通过liftover转换bed文件坐标1.1 下载转换的chain文件http://hgdownload.soe.ucsc.edu/downloads.html#humanhg19转hg38 的chainwget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/liftOver/hg19ToHg38.over.chain.gzhg38转hg19 的chainwget http://hgdownload.soe.ucsc.edu/goldenP
2020-06-14 12:16:51
4984
1
原创 python的 py文件与pyc文件编译 / 反编译
1. 什么是py与pyc文件.py与.pyc文件的区别2.编译pycpython -m compileall file.py 编译完成的文件会在 __pycache__下面3. 反编译pyc文件使用conda安装 uncompylepip install uncompyle./uncompyle file.pyc > file.py这样 pyc文件就可读了...
2020-06-14 10:45:32
307
原创 hunman参考基因组下载及索引建立
进入UCSC官网,进入hunman基因组页面,点击基因组数据,下载hg38.analysisSet.2bitwget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/analysisSet/hg38.analysisSet.2bit下载UCSC工具包,将2bit格式的参考基因组转为fasta格式rsync -aP rsync://hgdownload.soe.ucsc.edu/genome/admin/exe/linux.x86
2020-06-13 18:50:26
2074
原创 MongoDB数据库安装部署
1. 数据库分类关系型数据库(RDBMS)MySQL , Oracle , DB2 , SQL Sever `````非关系型数据库(No SQL)MongoDB , Redis ``````MongoDB中层级关系在MongoDB数据库中左侧的表就是collection , 右侧的每条数据就是document,document内以Bjson的形式保存数据内容。document内内容格式:2. MongoDB下载wget https://fastdl.mongodb.org
2020-06-07 18:26:59
269
原创 python 类 中 __dict__ 赋值变量
python类中__dict__属性返回的是实例对象中当前已经定义的所有自定义实例变量的名和值,为字典的形式class Persion(): def __init__(self,par1,par2,par3,par4): self.par1 = par1 self.par2 = par2 self.par3 = par3 self.par4 = par4 def female(self): pass def male(self): passP = Persion("a
2020-06-04 20:37:46
1357
原创 Linux 实用小命令
对文件不同列进行连接--output-delimiter 连接符-f 切片的列-d 切片的分隔符,默认Tabcut --output-delimiter=_ -f 2,3,5,6 input_file.txt
2020-05-24 16:04:59
141
原创 ichorCNA 的下载使用
1. 安装 HMMCopy先用conda search HMMCopy没有这个安装包,手动安装mkdir HMMcopycd HMMcopywget https://github.com/shahcompbio/hmmcopy_utils/archive/master.zipunzip master.zipcmake .make把HMMcopy加入环境变量PATH=path_to_HMMcopy/HMMcopy/hmmcopy_utils-master/bin:$PATH后面会用
2020-05-14 21:09:18
2169
原创 python创建可以迭代的类
python中可以使用 for … in …进行遍历(迭代)的数据类型,都是可迭代的对象。如 列表,字符串,字典,元组 都是可迭代的(Iterable),而浮点数,整型,布尔值都是不可迭代。for i in [1,2,3,4]: print(i)for i in "abcd": print(i)for i in {"key1":1,"key2":2,"key3":3}: print(i...
2020-04-16 00:36:30
1638
mutation_pattern 进行突变特征分析。
2022-08-04
python计算均值与exce计算结果不同?
2021-01-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人