
Bioinfo
文章平均质量分 91
生信宝典
好人!
展开
-
富集分析和基因表达花样可视化
GOplot包介绍GOplot包用于生物数据的可视化。更确切地说,该包将表达数据与功能分析的结果整合并进行可视化。但是要注意该包不能用于执行这些分析,只能把分析结果进行可视化。在所有科学领域,由于空间限制和结果所需的简洁性,切实地去描述事物很难,所以需要将信息进行可视化,使用图片来传达信息。精心设计的图形能在更小的空间提供更多的信息。该包的设想就是能让用户快速检查大量数据,揭示数据的趋势和找出数...原创 2019-07-22 09:45:22 · 7791 阅读 · 4 评论 -
Nature综述|整合组学分析护航健康,推动精准医学时代的到来!
之前搜集免费生物AI插图时简单提到了通路数据库Reactome,这些精美的生物插图只能算是该数据库附赠的小礼品,他的主要功能还是作为一个开源的通路数据库,为相关领域的研究者提供直观的可视化生物信息学工具。目前该库覆盖了19个物种的通路研究,且更偏重生化反应,包括经典的中间代谢、信号转到、基因转录调控、细胞凋亡与疾病。数据库引用了100多个不同的在线生物信息学资源库,包括NCBI、Ensembl...原创 2018-09-26 10:18:29 · 1609 阅读 · 0 评论 -
引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!
蛋白研究过程中,一般认为氨基酸的序列决定了蛋白的结构,结构决定功能(一般指蛋白的三维结构)。然而,近50年的研究中,有一种没有特定三维结构的蛋白不断被研究人员发现,由于这类蛋白无法折叠成稳定的三维结构而称为固有无序蛋白(intrinsically disordered regions,IDRs)。这类蛋白虽然缺乏稳定结构且高度可变,但是研究却发现他们在生物体内行驶着重要的生物学功能。图1 ...原创 2018-09-26 10:11:16 · 8816 阅读 · 0 评论 -
免费Linux系统和生信宝典原创学习教程
生物信息的学习离不开Linux系统,不管自己写命令处理数据,还是使用现有的工具。Linux对我们来讲最重要的是它强大的命令行功能,可以快速、批量、灵活的处理数据的提取、统计和整理等耗时耗力的重复性工作。事实上在日常生信分析中,多数整理工作也都是用Linux命令的组合完成的,相比于写完整的Python或Perl程序更简便快捷;另外,生信分析用到的工具大都只在Linux下运行,而Linux发行版众多,...原创 2018-09-13 17:12:43 · 910 阅读 · 0 评论 -
2018 Cell系列相变最强综述,未来已来,你在哪?
导读Trends in Cell Biology (Cell系列综述, 2018 IF: 18.564)于2018年6月1日在线发表了Steven Boeynaems(PhD Biomedical sciences, Stanford University School of Medicine, 一作兼通讯)撰写的关于蛋白质相位分离综述一文《Protein Phase Separati...原创 2018-08-31 10:14:43 · 6968 阅读 · 0 评论 -
肿瘤化疗无效是对预先存在的突变的选择还是诱发新突变,Cell给你答案
三阴乳腺癌(TNBC)是乳腺癌的一种侵袭性亚型,常对化疗产生耐药性。而耐药性的产生到底是之前存在的稀有突变细胞受到选择还是新基因突变导致的,仍是一个谜团。为研究该问题,Charissa Kim等人利用混合细胞外显子测序以及单细胞DNA和RNA测序,对新辅助化疗(NAC)期间20名TNBC患者进行跟踪分析。深度外显子组测序结果显示10例病人化疗后原始突变消失,10例病人化疗后突变依然存在。对其中...原创 2018-07-27 14:18:51 · 856 阅读 · 0 评论 -
生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得—限时免费
海哥,中国科学院遗传与发育生物学研究所,生物信息学博士。在生信宝典出品过多部“傻瓜式”教程。生信宝典之傻瓜式 (一) 如何提取指定位置的基因组序列 生信宝典之傻瓜式 (二) 如何快速查找指定基因的调控网络 生信宝典之傻瓜式 (三) 我的基因在哪里发光 - 如何查找基因在发表研究中的表达 生信宝典之傻瓜式 (四) 蛋白蛋白互作网络在线搜索 生信宝典之傻瓜式 (五) 文献挖...原创 2018-07-22 14:14:37 · 1058 阅读 · 0 评论 -
蛋白质组学研究概述
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...原创 2018-07-22 13:56:01 · 5966 阅读 · 0 评论 -
DESeq2差异基因分析和批次效应移除
差异基因鉴定基因表达标准化不同样品的测序量会有差异,最简单的标准化方式是计算 counts per million (CPM),即原始reads count除以总reads数乘以1,000,000。这种计算方式的缺点是容易受到极高表达且在不同样品中存在差异表达的基因的影响;这些基因的打开或关闭会影响到细胞中总的分子数目,可能导致这些基因标准化之后就不存在表达差异了,而原本没有差异...原创 2018-07-26 15:40:35 · 20191 阅读 · 1 评论 -
没钱买KEGG怎么办?REACTOME开源通路更强大
之前搜集免费生物AI插图时简单提到了通路数据库Reactome(https://reactome.org/), 那些精美的生物插图只能算是该数据库附赠的小礼品,他的主要功能还是作为一个开源的通路数据库,为相关领域的研究者提供直观的可视化生物信息学工具。在一定程度上,可以替代收费的KEGG数据库,而且拓展出很多新的通路。目前该库覆盖了19个物种的通路研究,包括经典的代谢通路、信号转导、基因转录调控...原创 2018-10-02 21:02:13 · 9618 阅读 · 0 评论 -
加拿大生信开源学习资源Bioinformatics.ca
之前给大家推荐过教育部首批490门“国家精品在线开放课程”,里面很多跟生物相关的免费经典课程。除了国内这些开放的学习资源外,还有许多国外的免费资源,今天给大家推荐的是 加拿大安大略癌症研究所(Ontario Institute for Cancer Research) 推出的各种生信课程。该机构每年都会举办数场生物信息学研讨会(CBW),并共享其课件与视频,每一份都是沉甸甸的财富,真业内良心!!!...原创 2018-10-25 10:23:16 · 685 阅读 · 0 评论 -
Graphpad,经典绘图工具初学初探
大多数科研文章都离不开图表,尤其是图,熟悉一些绘图软件,并将图在文章和PPT中展示出来,是科研训练的重要内容。漂亮的文章配图能给自己的工作加不少分,但是多数科研者只会使用Excel作图,反复修改也没法达到预期的效果。Graphpad , Origin和SigmaPlot是科研领常用的三款统计作图软件,他们各有优缺点,经常需要配合使用。今天给大家介绍的是Paragraph的基本使用方法了解gra...原创 2018-10-25 10:30:41 · 16768 阅读 · 0 评论 -
获取pheatmap热图聚类后和标准化后的结果
pheatmap是简单常用的热图绘制包,可以快速、简单、可定制的绘制漂亮热图。具体见R语言学习-热图简化和免费高颜值可定制在线绘图工具 ImageGP。现在要解决的一个问题是图出来了,想看下转换后用于绘图的表格,也就是获取聚类后的矩阵和聚类标准化后的矩阵。生成测试数据mat <- matrix(rnorm(30), nrow=5)colnames(mat) <- paste(...原创 2019-06-17 16:01:37 · 7335 阅读 · 0 评论 -
单基因GSEA,还是基于单基因表达谱分组后的GSEA?
今天在讨论群看到有群友提问 单基因GSEA怎么做?。之前也看到过这个概念,但一直不清楚这个单是什么含义,一直以为是用单个基因做GSEA。如果之前看过生信宝典的一文掌握GSEA,超详细教程,一定会特别熟悉GSEA的原理和操作流程。当然越是理解,越是想不明白单个基因怎么做GSEA。当然如果您不熟悉GSEA,建议先看上一篇文章。后来群友点拨理解了,不是对单个基因做GSEA,是拿单个基因 (一般是感兴趣...原创 2019-06-20 19:04:58 · 4436 阅读 · 0 评论 -
骨髓基质在正常和白血病个体中的细胞图谱|Cell最新(文末有彩蛋)
文章解读:Tiger文章校对:生信宝典研究背景基质细胞是几乎每个器官中都存在的定义不明确的非实质成分,在器官发育,体内平衡和修复中起关键作用。对骨髓基质的研究已经确定了干细胞生态位中的基质细胞的细胞亚型,其调节造血再生并且能够引发白血病。在这里,我们使用单细胞RNA测序(scRNA-seq)来定义小鼠骨髓基质的细胞分类和由恶性肿瘤引起的基质变化。我们鉴定了17个表达不同造血调节基因的基质亚...原创 2019-06-10 10:40:33 · 1884 阅读 · 0 评论 -
癌中之王:基质微环境塑造胰腺癌瘤内结构|Cell
文章解读:Tiger文章校对:生信宝典Summary:Single-cell technologies have described heterogeneity across tissues, but the spatial distribution and forces that drive single-cell phenotypes have not been well define...原创 2019-06-13 09:21:45 · 1796 阅读 · 0 评论 -
Science:通过单细胞转录组测序揭示玉米减数分裂进程
单细胞测序可以揭示单个细胞的微妙的变化并对细胞进行分型,在经历了动物单细胞的火热后,植物单细胞转录组的春天来了,Science, PC, PP, MP, bioRxiv各一个。本文详细解析了2019年4月,Brad Nelms和Virginia Walbot两位研究人员在Science期刊上通过单细胞转录组测序解释玉米减数分裂的进程。原文题目:Defining the developmental...原创 2019-05-22 14:02:24 · 2724 阅读 · 0 评论 -
原来Rproj还可以这么使用
原来Rproj还可以这么使用在别人的电子书,你的电子书,都在bookdown中我们讲述了bookdown的应用。里面涉及到一个文件Rproj用于项目管理。本身是一个很简单的文件,里面的内容一般不需要修改,只是放置在每个项目目录下即可。比如我们有个内容如下的ysx.Rproj文件,配置了一些参数,看单词都应该明白这些参数是什么含义。Version: 1.0RestoreWorkspace...原创 2019-05-22 14:00:12 · 3978 阅读 · 0 评论 -
生信分析过程中这些常见文件(fastq/bed/gtf/sam/bam/wig)的格式以及查看方式你都知道吗?
生信分析过程中,为了得到分析结果,我们除了需要原始测试数据fastq之外,还需要准备基因组文件*.fa和基因注释文件*.gtf,此间在分析的过程中还会伴随着众多中间文件的生成,如bed6、bed12、sam、bam、big、bigwig、bedgraph等,生成后我们一般会查看下内容了解文件每一列是什么含义,以此来决定需要提取哪些有用信息列来进行下一步分析。插播一个小剧场老板:“先查看一下sa...原创 2019-03-01 20:47:59 · 20115 阅读 · 3 评论 -
12个ggplot2扩展包帮你实现更强大的可视化
ggplot2自从2007年推出以来,成为世界范围内下载最频繁、使用最广泛的R包之一。许多人包括ggplot2的创建人Hadley Wickham将这一成功归功于ggplot2背后的哲学。这个软件包的灵感来源于Leland Wilkinson编写的《图形语法》一书,在此书中将graphs 分解成scales和layers,并将原始数据与表现形式分离开。具体使用可见下面简化示例和后面列出的往期绘图...原创 2018-12-07 10:11:44 · 3673 阅读 · 2 评论 -
R包reshape2,轻松实现长、宽数据表格转换
title: “reshape2”author: “lld”date: “2018年11月1日”output: html_document一、reshape2 简介reshape2是由Hadley Wickham编写的R包,可以轻松地在宽格式(wide-format)和长格式(long-format)之间转换数据。reshape2R包主要有两个主要的功能:melt和castme...原创 2018-12-07 09:29:14 · 17708 阅读 · 1 评论 -
整合QC质控结果的利器——MultiQC
title: “MultiQC”author: “lld”date: “2018/11/26”output: html_document一、MultiQC介绍NGS技术的进步导致大量的测序数据产生,也为新的分析类型和实验设计打开了大门。当我们不断扩大样本数量的同时也使得研究越来越容易受到批量处理效应的影响(可以采用DESeq2移除批次效应)。这就需要后续仔细的质量控制分析,大多数生信工...原创 2018-11-28 18:16:01 · 10166 阅读 · 0 评论 -
Excel改变了你的基因名,30% 相关Nature文章受影响,NCBI也受波及
EXCEL是常用的查看表格的工具,提供了很好的数据筛选、绘图等功能,不少基因表达数据也会在EXCEL中打开查看、筛选和排序。还有 3 个超赞的 EXCEL 插件,让你 5 分钟从小白变大神。但是EXCEL也会出现比较尴尬的事情,如基因名字的转换。比如gene symbols SEPT2 (Septin 2)、MARCH1 [Membrane-Associated Ring Finger (C3H...原创 2018-10-25 11:19:22 · 1147 阅读 · 0 评论 -
“不务正业”的化学奖又发给了生物
斯德哥尔摩时间10月3日11时45分(北京时间10月3日17时45分),2018年诺贝尔化学奖揭晓。Frances H. Arnoid因研究酶的定向功能改造而分享一半奖金;George P. Smith 和Sir Gregory P. Winter****噬菌体展示技术基于的抗体改进而共享另一半奖金。从1901年至2018年的诺贝尔化学奖历年获奖数据概览见下图所示,绘制方法见:networ...原创 2018-10-25 11:12:55 · 484 阅读 · 0 评论 -
NGS基础:测序原始数据下载
生物或医学中涉及高通量测序的论文,一般会将原始测序数据上传到公开的数据库,上传方式见测序文章数据上传找哪里;并在文章末尾标明数据存储位置和登录号,如 The data from this study was deposited in NCBI Sequence Read Archive under accession SRA: SRP114962.。NCBI的SRA (Sequence Rea...原创 2018-07-12 21:04:07 · 6103 阅读 · 0 评论 -
基因组浏览器使用 (EPGG)
基因组浏览器是高通量测序分析的一个重要的可视化工具。相比于最终提供的表格,基因组浏览器可以提供更多的信息,如直观展示突变位点、查看有无新转录本或新的可变剪接形式、查看peak的可信度、上下游基因、区域保守性、重复元件、蛋白结合motif等。我们前面有测序数据可视化列举了4个常用的高通量数据可视化工具,详细介绍了IGV基因组浏览器可视化高通量测序数据和UCSC 基因组浏览器的安装使用。最近几...原创 2018-07-12 21:02:39 · 3652 阅读 · 0 评论 -
易生信极高性价比暑期黑马集训 -- 低至2500每人
开课背景生物信息学说起来很好理解,可是对大部分想学习生信的人来说,操作起来却是有些棘手,无有头绪。生信的研究内容主要包括两个方面:首先,需要生物研究者利用实验收集、整理、储存、获取生物学数据;另一方面,需要依托数理信息科学的技术和方法管理和分析数据。如今工具开发者(IT)和工具应用者(Biologist)的界限越来越模糊,只要您是生信领域的工作者,都需要了解生物信息学分析基本知识。生物学家...原创 2018-07-09 20:21:33 · 524 阅读 · 0 评论 -
文章用图的修改和排版 (一)
微信公众号:http://mp.weixin.qq.com/s/IJNyhinakY0lSXgCN7b9ug author: ct layout: post categories: - Bioinfo tags: - Bioinfo一年一度的教师节到了,首选祝愿各位老师节日快乐。在科研领域,对老师最好的献礼就是就是不辜负老师的教诲,做出好的科研工作,获得有价值的科研成果。成果发表是科原创 2017-09-20 12:00:30 · 949 阅读 · 0 评论 -
不用Linux也可以的强大文本处理方法
标题党了,其实是论VIM的使用。做生物信息分析最合适的还是Linux操作系统,所以生信宝典在最开始就推出了Linux学习系列,由浅入深的讲述了Linux学习中的关键点。主要文章列举如下:Linux学习-文件和目录Linux学习-文件操作Linux文件内容操作Linux学习-环境变量和可执行属性Linux学习 - 管道、标准输入输出Linux学习 - 命令运行监测和软件安装Linux学习原创 2017-08-25 14:29:34 · 479 阅读 · 0 评论 -
本地使用Rfam 12.0+ (最新版教程)
Rfam是用来鉴定non-coding RNAs的数据库,常用于注释新的核酸序列或者基因组序列。最新版本的Rfam (12.2),包含2588个RNA家族,其在线网站提供了便捷的查询使用功能,http://rfam.xfam.org/,尤其是对小批量数据。对已经注释好的物种,建议在ENSEMBLE或UCSC直接下载官方的注释文件,直接下载GTF或使用bioMart或TableBrowser都可。具体原创 2017-06-17 14:28:40 · 6624 阅读 · 4 评论 -
39个转录组分析工具,120种组合评估
RNA-seq工具哪家强RNA-seq分析工具知多少RNA-seq是研究转录组应用最广泛,也最重要的技术之一。RNAseq其分析内容包括序列比对、转录本拼装、表达定量、差异分析、融合基因检测、可变剪接、RNA编辑和突变检测等,具体流程和常用工具如下图所示。通常的分析不一定需要走完全部流程,按需进行,某些步骤可以跳过、简化等。RNA-seq分析工具最优组合Nature Communication上一篇原创 2017-08-05 09:27:59 · 15663 阅读 · 0 评论 -
R 学习 - 火山图
火山图火山图用于展示基因表达差异的分布,横轴为Log2 Fold Change,越偏离中心差异倍数越大;纵轴为(-1)*Log10 P_adjust,值越大差异越显著。一般横轴越偏离中心的点其纵轴值也会比较大,因此呈现火山喷发的形状。一步绘制火山图输入数据格式火山图需要的数据格式如下 (本文用到的数据文件名为volcano.txt,文末有下载链接,此处截取一部分作为例子,也可用来画图,只是数据少,效原创 2017-08-01 08:27:48 · 20770 阅读 · 5 评论 -
R 学习 - 散点图
散点图散点图在生物信息分析中是应用比较广的一个图,常见的差异基因火山图、功能富集分析泡泡图、相关性分析散点图、抖动图、PCA样品分类图等。凡是想展示分布状态的都可以用散点图。横纵轴都为数字的散点图解析绘制散点图的输入一般都是规规矩矩的矩阵,可以让不同的列分别代表X轴、Y轴、点的大小、颜色、形状、名称等。输入数据格式 (使用火山图的输入数据为例)火山图需要的数据格式如下id: 不是必须的,但一般的软原创 2017-08-01 08:23:50 · 5232 阅读 · 0 评论 -
R 学习 - 富集分析泡泡图回应
R语言学习 - 富集分析泡泡图 刚一出品,Y叔就说有硬伤。Y叔是著名富集分析软件clusterprofiler的原创,而且软件内集成dotplot, enrichmap,cnetmap (后续也实现这两个的一步出图)等画图方法,具体看这个教程 http://guangchuangyu.github.io/2016/01/go-analysis-using-clusterprofiler/ 或Biob原创 2017-08-01 08:22:59 · 12597 阅读 · 0 评论 -
生信宝典:生物信息学习系列教程、视频教程
生信宝典公众号是中科院遗传所2015年生物信息博士毕业生陈同创建,致力于传播生信知识,帮助生信入门和生信分析,近来也在做生信培训广受好评。生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题。但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程序。也许你可以跟着一个测序分析流程完成操作,但不懂得背后的...原创 2017-08-01 08:22:15 · 10765 阅读 · 1 评论 -
R 学习 - 箱线图
箱线图箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图。在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的好处和一个在线绘制箱线图的工具。就这样都可以发两篇Nature method,没天理,但也说明了箱线图的重要意义。下面这张图展示了Bar plot、Box plot、Volin plot和Bean plot对数据分布的反应。从Bar plot上原创 2017-08-01 08:21:12 · 39518 阅读 · 2 评论 -
Linux bash学习
更多生信和LInux学习,程序写作,请扫描关注生信宝典。https://mp.weixin.qq.com/mp/homepage?__biz=MzI5MTcwNjA4NQ==&hid=6&sn=667813e1f021e2cf155a74457b48d087&scene=18&uin=&key=&devicetype=Windows+UnKnow&version=62040549&lang=zh_C原创 2017-07-30 10:02:49 · 1384 阅读 · 0 评论 -
R 学习 - 线图
更多生信和Linux学习,程序写作,请扫描关注生信宝典。https://mp.weixin.qq.com/mp/homepage?__biz=MzI5MTcwNjA4NQ==&hid=6&sn=667813e1f021e2cf155a74457b48d087&scene=18&uin=&key=&devicetype=Windows+UnKnow&version=62040549&lang=zh_C原创 2017-07-30 10:05:50 · 1177 阅读 · 0 评论 -
生信宝典,生物信息学习资源
内容列表:R语言学习 - 热图简化R语言学习 - 热图美化R语言学习 - 基础概念和矩阵操作R语言学习 - 热图绘制 (heatmap)R语言学习 - 入门环境RstudioR语言学习 - 入门环境RstudioLinux学习-常见错误和快捷操作Linux学习-环境变量和可执行属性Linux学习-文件排序和FASTA文件操作原创 2017-07-06 19:52:32 · 993 阅读 · 1 评论 -
R绘制热图
欢迎关注 生信宝典 公众号,阅读系列文章http://mp.weixin.qq.com/s/lKrhvYrwn93esC6MA3bHWwRstudio基础R语言是比较常用的统计分析和绘图语言,拥有强大的统计库、绘图库和生信分析的Bioconductor库,是学习生物信息分析的必备语言之一。Rstudio是编辑、运行R语言的最为理想的工具之一,支持纯R脚本、Rmarkdown (脚本文档混排)、Boo原创 2017-07-06 08:40:44 · 29433 阅读 · 0 评论