
生信
文章平均质量分 79
柚子味的羊
这个作者很懒,什么都没留下…
展开
-
关于基因的那些事(1)
关于基因的那些事(1)文章目录关于基因的那些事(1)1. 基因ID2. refGene每一列不同的含义1. 基因ID对于一个基因会有不同的mRNA转录本,进一步会有不同的蛋白异构体。在gene数据库里对于转录本和蛋白的编号是以NM和NP开头的。如果是NM的话则代表是转录本编号,如果是NP的话则是蛋白编号。我们检索的这个基因是一个非编码的RNA(ncRNA)的话,那关于转录本的注释就从之前的NM开头变成了NR开头了。2. refGene每一列不同的含义第1列bin:Indexing field t原创 2022-05-07 19:31:13 · 2813 阅读 · 0 评论 -
pipeline——(2)
pipeline——(2)文章目录pipeline——(2)step 1 生成indexstep 2 生成bamstep 3 组装转录本step 4 merge组装的转录本step 5 生成saf文件step 6 选择TE转录本step 1 生成indexstar.shSTAR \--runMode genomeGenerate \--runThreadN 20 \--genomeFastaFiles /share/pub/wangxy/software/genome/ucsc/hg38/原创 2022-05-07 19:29:25 · 609 阅读 · 0 评论 -
pipeline——(1)
Rscript export_saf_file.r -g /share2/pub/yangjy/yangjy/database/hg38_refGene.txt #参考基因注释文件-r /share2/pub/yangjy/yangjy/database/hg38_rmsk.txt #rmsk文件的路径-l /share2/pub/yangjy/yangjy/database/STAR_index69/chrNameLength.txt #染色体长度文件的路径-n hg38 #输出数据name-m原创 2022-05-07 16:20:53 · 838 阅读 · 0 评论 -
TACO——(1)安装
Taco——(1)安装一、package下载git clone https://github.91chi.fun/https://github.com/tacorna/taco.git二、build三、测试文章目录Taco——(1)安装一、package下载二、build三、测试stringtie采用了组装转录本和估计表达量同步进行的方法,不同于cufflinks的先组装后定量的策略ls -R /share2/pub/yangjy/yangjy/rna-seq-data/GSE14688原创 2022-05-07 10:32:39 · 1194 阅读 · 0 评论 -
Stringtie2——(2)参数和使用
Stringtie2——(2)参数文章目录Stringtie2——(2)参数1.Attention!一、基本用法1.[options]二、使用三、输出文件1.Attention!1.Stringtie的输入文件必须按基因组位置排序。在STAR比对生成bam的过程中使用sorted…已经排好序2.输入BAM文件中的每个 spliced read 比对(即跨越至少一个连接点的比对)必须包含标签XS,用以指示测序产生的read是来源于基因组序列上的哪条链产生的RNA。由TopHat和 HISAT2 (需原创 2022-05-06 14:38:50 · 2454 阅读 · 1 评论 -
Stringtie2——(1)安装
Stringtie2——(1)安装文章目录Stringtie2——(1)安装一、introduction二、GitHub下载安装三、编译四、环境变量五、测试一、introductionstringTie 可以看做是cufflinks 软件的升级版本,其功能和cufflinks是一样的 ,包括下面两个主要功能转录本组装定量相比cuffinks, 其运行速度更快。二、GitHub下载安装git clone https://github.91chi.fun/https://github.com原创 2022-05-06 10:42:46 · 3019 阅读 · 0 评论 -
RNA-seq 比对软件STAR——(2)使用
RNA-seq 比对软件STAR——(2)使用一、参数说明详见——>manual(1) readFilesIn要映射序列文件的名称(带路径),注如果文件是压缩的文件使用readFilesCommand参数进行解压缩。如果是(*.gz)使用 --readFilesCommand zcat或 --readFilesCommand gunzip -c,对于bzip2压缩文件,使用–readFilesCommand bunzip2 -c(2) outFileNamePrefix输出文件的前缀(包含原创 2022-05-06 10:01:30 · 3316 阅读 · 0 评论 -
RNA-seq 比对软件STAR——(1)安装
RNA-seq 比对软件STAR——(1)安装文章目录RNA-seq 比对软件STAR——(1)安装一、package下载二、编译三、环境配置四、测试一、package下载在GitHub知道package,使用加速复制链接下载。我需要2.7版本以上,所以下载最新版,建议没有特定需求下载最新版,bug修复的差不多了,更便捷#直接gitclonegit clone https://github.91chi.fun/https://github.com/alexdobin/STAR.git#或者wge原创 2022-05-05 19:18:12 · 5553 阅读 · 0 评论 -
RepeatMasker(一)——安装及使用
RepeatMasker安装及使用文章目录RepeatMasker安装及使用一、安装1. RMBlast序列搜索引擎2.TRF搜索串联重复序列3. repeatmasker下载4. Repbase数据库5. 配置repeatmasker依赖关系二、使用1.参数说明2.输入3. 使用RepeatMasker三、结果1. masked文件2. out文件3. out.gff文件(和.out文件完全一样)4. out.html文件(和.out文件一样,只是在html,显示方式不同罢了)5. polyout文件—原创 2022-04-25 11:14:18 · 14060 阅读 · 4 评论 -
Topic 1 Single_Cell_analysis(4)
Topic 1 Single_Cell_analysis(4)文章目录Topic 1 Single_Cell_analysis(4)Part 1 Scissor() debug——binomial 数据处理1.1 加载package1.2 加载单细胞数据1.3 将单细胞数据转化为Seurat类型1.4 加载bulk数据1.5 parameter 赋值1.6 检查bulk-cell和single-cell的intersect1.7 得到processed data 和 细胞间的network1.8 将net原创 2022-03-28 19:35:08 · 822 阅读 · 0 评论 -
Topic 1 Single_Cell_analysis(3)
Topic 1 Single_Cell_analysis(3)文章目录Topic 1 Single_Cell_analysis(3)Part 1 Scissor1.1 流程图1.2 如何将matrix转换为Seurat1.3Part 1 Scissor1.1 流程图1.2 如何将matrix转换为SeuratCreateSeuratObjectFindVariableFeaturesScaleDataRunPCAFindNeighbors1.3......原创 2022-03-28 11:21:19 · 460 阅读 · 0 评论 -
Topic 1 Single_Cell_analysis(2)
Topic 1 Single_Cell_analysis(2)文章目录Topic 1 Single_Cell_analysis(2)Part 1 Scissor——logistic regression1.下载bulk-dataset和phenotype(TP53mutant作为phenotype)2.Scissor选择有信息量的细胞(informative cells)Part 2 Scissor 结果解释注:Development1.label2.model of selected cell and原创 2022-03-24 21:08:21 · 247 阅读 · 0 评论 -
Topic 1 Single_Cell_analysis(1)
Topic 1 Single_Cell_analysis文章目录Topic 1 Single_Cell_analysisPart1 PlanPart2 原始数据复现——LUADPart3 Scissor使用cox regression1.prework2.准备单细胞数据2.1 Seurat_preprocessing()3.Part1 Plan原始数据复现使用其他疾病的数据,查看效果,更深入了解代码根据cell-cell之间的空间结构,得到相关性较强的cell簇,作为新的特征原始的回归方法原创 2022-03-23 20:46:09 · 896 阅读 · 0 评论 -
氨基酸三字母序列转单字母序列
氨基酸三字母序列转单字母序列1.氨基酸对照数据对照数据集:提取码:amin实例数据:提取码:data2. 对照code#%% 氨基酸的3 to 1 #导入packageimport pandas as pdfrom pandas import DataFrame as dfimport numpy as npimport re Amino_acid_path="D:\Topic\\alphafold\\Amino_acid.csv"#氨基酸对照表路径amino_acid=pd.原创 2022-03-20 14:16:46 · 2458 阅读 · 0 评论 -
RoseTTAFold安装——alphafold的平替(4)
RoseTTAFold安装——alphafold的平替(4)文章目录RoseTTAFold安装——alphafold的平替(4)一 、log content1. network.stderr2. network.stdout3. script.o4. script.e二、Error三、小结今天周末,原本想在宿舍的,但是起床后发现没什么事情可以做的,而且在宿舍网不好,看剧运动都没那么称心如意。所以还是来实验室,发现自己在实验室再无聊也可以看看巡回检查组。昨天因为下雨回去的早,原本想在宿舍打拳的,结果发现打原创 2022-03-20 13:01:10 · 2787 阅读 · 3 评论 -
RoseTTAFold安装——alphafold的平替(3)
RoseTTAFold安装——alphafold的平替(3)文章目录RoseTTAFold安装——alphafold的平替(3)一、result文件详情1.hhsearch.stderr2.hhsearch.stdout——blank3.make_msa.stderr4.make_msa.stdout5.make_ss.stderr6.make_ss.stdout二、error集合1. error 1 in hhsearch.stderr——sequence ss_pred contains no res原创 2022-03-19 13:39:00 · 1663 阅读 · 1 评论 -
RoseTTAFold安装——alphafold的平替(2)
RoseTTAFold安装——alphafold的平替(2)文章目录RoseTTAFold安装——alphafold的平替(2)6. 获取PyRosetta许可证7. 在conda环境中安装软件——PyRosetta接上一篇RoseTTAFold安装——alphafold的平替(1)在下载数据的时候在下载中间那个BFD的时候,出现bug,重新编辑一下脚本cd /share2/pub/yangjy/yangjy/softs/RoseTTAFold/wget https://bfd.mmseqs.co原创 2022-03-18 17:03:54 · 1581 阅读 · 0 评论 -
RoseTTAFold安装——alphafold的平替(1)
RoseTTAFold安装——alphafold的平替文章目录RoseTTAFold安装——alphafold的平替1. 下载GitHub package2. 创建环境3. 下载network的权重4. 安装第三方软件5. 下载数据——大!终究还是错付了,我尽心尽力的尝试了alphafold的各种情况但是都没有成功。只要思想不退步,办法总比困难多!另辟蹊径——师兄出招,用平替!总不能止步不前吧,那个正版的alphafold等我过几天再学习一下docker吧,担心老板最近要找我问进度,也得有个东西呀!随原创 2022-03-16 17:08:39 · 1683 阅读 · 2 评论 -
AlphaFold安装——非docker镜像(4)
AlphaFold安装——非docker镜像(4)文章目录AlphaFold安装——非docker镜像(4)Error 1. Failed to create session: Internal: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime versionError 1. Failed to create session: Internal: cudaGetDevice()原创 2022-03-13 17:35:43 · 3198 阅读 · 6 评论 -
AlphaFold安装——非docker镜像(3)
AlphaFold安装——非docker镜像(3)文章目录AlphaFold安装——非docker镜像(3)Error 1. flag --use_gpu_relax=None: Flag --use_gpu_relax must have a value other than None.Error 2. 显示我的jaxlib版本不对Warning 3. Unable to initialize backend 'tpu_driver': NOT_FOUND: Unable to find driver原创 2022-03-12 16:15:22 · 3332 阅读 · 6 评论 -
AlphaFold安装——非docker镜像(2)
AlphaFold安装——非docker镜像(2)原创 2022-03-09 21:05:53 · 1667 阅读 · 5 评论 -
AlphaFold安装——非docker镜像(1)
AlphaFold安装——非docker镜像参考教程最近在配置alphafold环境,按照GitHub上的readme进行,需要在docker前提下进行,找管理服务器的师兄开了权限,但是期间很多次都需要重启docker,卑微没有root权限,没法搞定,搞得整个人心态爆炸,所以不打算在docker下搭了。普及:docker在几年前很火,但是现在他的大势已去,主要因为很多地方需要root权限,这对大多数人来说是很大的不便。文章目录AlphaFold安装——非docker镜像1、安装miniconda2、原创 2022-03-09 19:15:49 · 3501 阅读 · 3 评论 -
RNA-seq之QAPA量化后差异分析
RNA-seq之QAPA量化后差异分析秩和检验和t检验数据处理原创 2022-03-04 17:15:27 · 1736 阅读 · 1 评论 -
生信入门(七)——数据预处理1
生信入门(七)——数据预处理1文章目录生信入门(七)——数据预处理1一、用基本包处理数据框1.查看数据框中的内容2、选取数据库的子集3、将数据按照某个变量的值排序:order()4、查找和删除数据:duplicated()5、在数据框中添加和删除变量6、把数据框添加到搜索路径后面几节,将分别使用基本包和当前流行的 dplyr 包处理数据框,并介绍数据框的合并、长宽格式的转换、缺失值的处理、处理大型数据集的策略等操作。一、用基本包处理数据框加载epiDisplay包里的小型数据集Familydata原创 2021-10-18 21:28:02 · 2315 阅读 · 0 评论 -
生信入门(六)——单细胞分析(Seurat)
生信入门(六)——单细胞分析(Seurat)文章目录生信入门(六)——单细胞分析(Seurat)一、数据导入1、数据来源2、数据导入二、标准预处理1、QC和选择细胞进行进一步分析2、规范化数据3、识别高度可变的特征(特征选择)4、缩放数据三、主成分分析(PCA)1、线性降维2、确定数据集的“维度”四、聚类细胞五、非线性降维(UMAP/tSNE)六、寻找差异表达的特征(簇生物标志物)一、数据导入1、数据来源点击此处下载数据数据说明:分析10X Genomics提供的外周血单细胞(PBMC)数据集,有原创 2021-10-06 18:55:58 · 52483 阅读 · 5 评论 -
生信入门(五)——使用DESeq2进行RNA-seq数据分析
生信入门(五)——使用DESeq2进行RNA-seq数据分析文章目录生信入门(五)——使用DESeq2进行RNA-seq数据分析四、探索性数据分析五、差异数据分析六、AnnotationHub本篇接上一篇,本篇做探索性数据分析,差异表达分析以及后面步骤四、探索性数据分析五、差异数据分析六、AnnotationHub...原创 2021-09-30 18:11:33 · 4259 阅读 · 7 评论 -
生信入门(四)——使用DESeq2进行RNA-seq数据分析
生信入门(三)——使用DESeq2进行RNA-seq数据分析文章目录生信入门(三)——使用DESeq2进行RNA-seq数据分析一、学习目标二、实验数据1、数据来源2、建模计数数据3、转录本丰度4、salmon定量三、用tximport导入R1、指定文件位置2、将转录本映射到基因今日学习内容DESeq2分析RNA-seq数据一、学习目标直观地评估 RNA-seq 数据的质量对 RNA-seq 数据进行基本的差异分析将 RNA-seq 结果与其他实验数据进行比较从 FASTQ 文件中量化转录表原创 2021-09-24 09:22:02 · 5720 阅读 · 0 评论 -
生信入门(三)——使用limma、Glimma和edgeR,RNA-seq数据分析
使用limma、Glimma和edgeR,RNA-seq数据分析文章目录使用limma、Glimma和edgeR,RNA-seq数据分析六、差异表达分析1、创建设计矩阵和对比2、从表达计数数据中删除异方差3、拟合线性模型以进行比较4、检查DE基因数量5、检查单个DE基因6、差异表达结果可视化7、使用camera的基因检验本篇继续上一篇数据预处理之后做差异表达分析。六、差异表达分析1、创建设计矩阵和对比在此研究中,我们想知道哪些基因在我们研究的三组细胞之间以不同水平表达。我们的分析中所用到的线性模型原创 2021-09-22 17:50:04 · 5323 阅读 · 0 评论 -
生信入门(二)——使用limma、Glimma和edgeR,RNA-seq数据分析
生信入门(二)——使用limma、Glimma和edgeR,RNA-seq数据分析文章目录生信入门(二)——使用limma、Glimma和edgeR,RNA-seq数据分析一、简介一、简介简单且高效地分析RNA 测序数据的能力是生信的核心优势之一。通常在获得RNA-seq基因表达矩阵后,通常需要对数据进行数据预处理、探索性数据分析、差异表达检验以及通路分析,以得到可以帮助进一步试验和验证研究的结果。未来几篇将介绍使用edgeR包,limma包,Glimma包对RNA-seq数据展开分析,从原始计数(c原创 2021-09-21 20:09:59 · 6665 阅读 · 4 评论 -
生信入门(一)——DESeq2差异基因分析
生信(一)——DESeq2差异基因分析文章目录生信(一)——DESeq2差异基因分析一、差异基因分析原理二、代码实现1、前提:安装DESeq2包2.代码实现三、小结记录学习过程,共勉。一、差异基因分析原理详见二、代码实现1、前提:安装DESeq2包2.代码实现setwd("D:\\RData");#设置编码位置rt<-read.table("GSE149549_mRNA_Expression_Summary.txt",head=TRUE,row.names = 1)head(r原创 2021-09-17 15:47:22 · 20561 阅读 · 10 评论