
生物信息
文章平均质量分 55
twocanis
这个作者很懒,什么都没留下…
展开
-
基于R和gephi做宏基因组与代谢组等多组学联合network相关性网络图
拿到多组学的数据后一直在找合适的方法将二者进行关联,比如我这里是三种体液的代谢组与一种体液的宏基因组。需求是对多组学进行关联分析,直到最近看到不少文章里利用Gephi将相关性表格进行可视化的图,效果还不错,于是写个过程记录自用。这里演示的是属水平的差异菌群相对丰度(宏基因组结果)与代谢组鉴定到的差异代谢物进行关联。先是计算相关性生成graphml格式文件使用Gephi软件进行可视化。原创 2023-10-12 09:34:48 · 4349 阅读 · 0 评论 -
基于R做宏基因组的进化树ClusterTree分析
同上一篇的PCoA分析,这个也是基于公司结果基础上的再次分析,重新挑选样本,在公司结果提供的csv结果表上进行删减,本地重新分析作图。原创 2023-08-11 09:15:20 · 1794 阅读 · 0 评论 -
基于R做宏基因组结果的PCoA分析
选取不同样本属水平的丰度数据,利用r的vegan包等绘制PCoA图原创 2023-08-11 09:12:17 · 1003 阅读 · 0 评论 -
Echarts绘制差异代谢产物分类与KEGG通路分类的旭日图
将实验样本的代谢组进行数据可视化,利用Echarts绘制差异代谢产物分类与HMDB化学分类的旭日图原创 2022-01-06 11:20:21 · 3135 阅读 · 0 评论 -
基于R的ggplot2包画KEGG富集通路气泡图_KEGGdot
背景**基于公司已给出的结果上做出调整(公司只给出了top10),画KEGG富集通路的气泡图,初始文件如下图代码演示> getwd() #显示工作目录> setwd() #如果上述显示不是想要的路径,可以新建一个文件夹然后设置成工作目录,方便一些原始文件以及结果图片的存放> install.packages("ggplot2",destdir="D:/RData/R-win-4.0.2/R-4.0.2/R-packages",lib="D:/RData/R-win-4.0.2原创 2021-12-09 22:48:05 · 7894 阅读 · 1 评论 -
代谢组学分析常用网站
MetaboAnalyst 5.0MetaboAnalyst 5.0可进行代谢组数据的可视化分析,Module Overview如下,包括Biomarker Analysis/ Enrichment Analysis/Pathway Analysis/Joint Pathway Analysis/Network Analysis以及各种封图分析等,基本送测公司的报告里头的结果图,只要拿到excel检测结果信息表都能在这个网站自己做,操作简单直接上手Interactive Pathways Expl.原创 2021-12-09 22:00:07 · 4010 阅读 · 0 评论 -
从FASTA文件中批量提取指定序列【Python脚本】
文章目录前言一:读取含特定字符的序列并输出演示二:读到某一个字符之前的全部输出使用方法三:输出前n条序列使用方法总结前言背景:学测序流程的时候,做到mapping的时牛的基因组有两个多G,因为是在个人PC上初步学习,建立index实在太慢了,而且临时也没有现成的index。于是决定只挑基因组前十条染色体拿来练习(所以需要从基因组文件里选取序列,尝试自己用python写脚本处理)。python之前因为实在不聪明也就刚学到字典部分,借鉴了网上的一些内容整理了一下,写了几种情况关于利用python脚本提取f原创 2020-12-08 22:01:56 · 13051 阅读 · 0 评论 -
生信学习笔记:测序数据质控
文章目录测序数据质控1.原始数据统计2.质控数据统计测序数据质控Illumina 测序属于第二代测序技术,单次运行能产生数十亿级的reads,如此海量的数据无法逐个展示每条read的质量情况;运用统计学的方法,对所测序列进行统计和质控,可以从宏观上直观地反映出样本的文库构建质量和测序质量。1.原始数据统计1)原始数据获得 Illumina 平台通过将测序图像信号经CASAVA碱基识别(Base Calling)转换成文字信号,并将其以 fastq 格式储存起来作为原始数据。根据index序列区转载 2020-12-01 20:35:38 · 8536 阅读 · 0 评论 -
生信学习笔记:生物信息学测序分析基本流程入门笔记
文章目录前言短序列比对软件sam文件insertsize基因差异表达计算变异检测物种组成与丰富度计算kmer估计基因组大小序列拼接Pregraph常用序列拼接软件基因组污染分析RNA-seq与meta序列拼接基因功能注释非编码RNA小RNA共线性分析在线序列分析序列比对数据下载前言根据B站教程生物信息快速入门边自学边随手记的笔记,省略了开头几节测序原理以及数据质控,在之前的文章中有粗略提过该部分。目前我自己理解的大致流程基本就是测序——质控——比对拼接(contig、scaffol、mappingd原创 2020-11-25 11:39:01 · 12882 阅读 · 2 评论 -
生信学习笔记:用conda安装bwa、samtools和tophat2以及问题解决
用conda安装bwa、samtools和tophat2bwa$ conda install bwasamtools$ conda install samtoolstophat2安装wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.0.Linux_x86_64.tar.gz解压tar -zxvf tophat-2.1.0.Linux_x86_64.tar.gz加入环境变量pathexport原创 2020-11-16 16:24:13 · 15393 阅读 · 16 评论 -
生信学习笔记:fastp质控处理生成的report结果解读
文章目录前言raw data 和 fastq文件readsQ20和Q30N值AdaptersDuplicationInsertfastp reportsummaryAdapterInsert size estimationBefore filtering前言测序出来的数据利用fastp一个命令质控全搞定,无论是SE还是PE,同时会生成.json和.html格式的报告,十分直观方便,如何生成报告可查看 Linux下fastp的使用 ,下面记录一下如何理解这份报告。在这之前先整理几个概念:raw d原创 2020-11-13 21:00:17 · 30518 阅读 · 14 评论 -
生信学习笔记:单端测序(Single-read)与双端测序(Paired-End)
单端测序(Single-read)与双端测序(Paired-End)一图看区别:总的来讲就是单端测序只从一侧读,而双端测序是两头同时读然后拼接单端测序(Single-read)Single-Read测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列。该方式建库简单,操作步骤少,常用于小基因组、转录组、宏基因组测序。测序的质量会随着测序原创 2020-11-10 16:45:55 · 31580 阅读 · 0 评论