
生物信息学
文章平均质量分 84
ntuYision
淋巴细胞一旦被激活,也就为自己的死亡创造了条件。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
TCGA 临床数据 表型 phenotype 各列的含义
原文链接:http://www.cnblogs.com/emanlee/p/7635951.htmlProperty name Description kind The resource type. aliquots[] List of barcodes of aliquots taken from this participant. clinical_data...转载 2020-02-05 15:55:15 · 11480 阅读 · 0 评论 -
生物信息学入门 使用 RNAseq counts数据进行差异表达分析(DEG)——edgeR 算法 数据 代码 结果解读
差异表达分析通常作为根据基因表达矩阵进行生物信息学分析的第一步,有助于我们观察基因在不同样本中的表达差异,从而确定要研究的基因和表型之间的联系。常用的基因表达数据来自基因芯片或高通量测序。虽然矩阵看起来差不多,但是由于服从不同的分布,因此在进行差异表达的时候需要用不同的方法。对于一般的生命科学领域科研人员来说,了解晦涩的算法并没有太大价值。本文力求精简,从数据——算法——结果三个方面...原创 2019-03-25 09:17:58 · 33125 阅读 · 7 评论 -
生物信息学入门 GEO芯片数据差异表达分析时需要log2处理的原因
首先借用一张图,通常使用limma处理时,需要经过log2后的矩阵作为表达矩阵输入。根据log2FC的定义,这个数字表示变化倍数经过log2后的一个值,比如log2FC=1,则变化为2倍;log2FC=2,则变化为4倍。这是常用的一种表述方法。在使用limma函数计算时,如果输入的矩阵没有经过log2处理,则会把FC当成log2FC输入,这或许是因为limma默认输入的是log2后的表达式...原创 2019-03-13 22:14:11 · 48476 阅读 · 1 评论 -
生物信息学入门 GEO芯片数据差异表达分析时是否需要log2以及标准化的问题
GEO中的Series Matrix File(s)通常是经过了标准化和对数转换的数据。但不全是。在实际应用的时候需要根据情况判断一下。对于芯片数据,可能作者将.cel的文件处理成未标准化的数据直接上传。一般来说,在判断counts是否需要重新标准化以及是否需要log2时,可以根据数值大小粗略估计。如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。因为...原创 2019-03-13 22:14:22 · 35863 阅读 · 0 评论 -
生物信息学入门 富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南
网络图是生物信息学中常用的显示不同节点之间关联方向与关联程度的可视化方法。在富集分析中,网络图常被用于表示功能与估计到该功能的基因的联系。在蛋白质互作用网络中,网络图常用于表示编码基因之间的互作用类型与作用强度,基于这些信息,还可以通过某一节点与其他节点的连接数量来判断该节点在整个网络中的贡献度(degree)。绘制网络图常使用cystoscape软件,通过输入符合规范的数据,调整合适的参数,...原创 2019-03-01 10:16:08 · 56283 阅读 · 1 评论 -
差异表达分析(DEG)时 row.names'里不能有重复的名字 的解决方案
最近看到读者留言说在差异表达分析导入矩阵是提醒row name重复,现在就这一问题解释原因和最简单的解决方案。原因:探针和基因是多对一的关系,比如A和B都可能是指向基因AB。在一般的基因芯片的表达矩阵中,用探针表示的表达矩阵不存在行名重复问题。但是如果先注释成gene symbol,则可能不同行的探针注释成同一个gene symbol。这个时候如果还是用转换后的矩阵进行差异分析,在导入R...原创 2019-01-21 00:26:12 · 55824 阅读 · 3 评论 -
生物信息学入门 根据表达矩阵和差异表达基因列表制作差异表达矩阵
根据表达矩阵做完差异分析之后,就要将差异表达基因的表达情况从表达矩阵中提取出来,制作差异表达矩阵。这个过程非常简单,但是也有一些人问到,就整理了这个教程。1.数据准备:原始表达矩阵和差异表达基因这是原始矩阵这是差异基因列表2. Vlookup函数匹配Vlookup函数是Excel中数据匹配的常用函数首先插入一列做个标记插入新的一列输入...原创 2018-11-02 18:34:57 · 27910 阅读 · 3 评论 -
生物信息学入门 heatmap.2函数绘制热图(heatmap) 数据结构 代码 结果解读
热图是展示基因表达差异非常直观的方法,很多R语言包都支持绘制热图。下面分享一个根据heatmap.2函数绘制热图的方法。依然是数据-代码-结果。本帖力求精简,使新手尽可能快的成功,更多定制化的细节请参阅其他帖子!1.表达矩阵和分组矩阵表达矩阵和分组矩阵和做差异表达的结构是一样的,差异表达的帖子详见:https://blog.youkuaiyun.com/tuanzide5233/art...原创 2018-11-02 18:15:30 · 26422 阅读 · 7 评论 -
生存分析系列教程(一)使用生信人工具盒进行生存分析
生信人工具盒是生信人团队的开发的一款软件,非常方便。下面我将演示一下如何通过这款软件进行生存分析。为了方便大家理解,形式依然是 数据结构-操作-结果解读。1. 表达矩阵与生存信息矩阵表达矩阵依然是分成两部分,基因名和样本名,分别是行名和列名。其中null数据软件会自动过滤掉。生存信息矩阵,这里包括两部分,生存时间和状态。注意这里生存时间的单位是日,死亡状态是1,生存状态是0....原创 2018-11-03 11:31:59 · 8230 阅读 · 0 评论 -
生物信息学入门 使用 GEO基因芯片数据进行差异表达分析(DEG)——Limma 算法 数据 代码 结果解读
差异表达分析通常作为根据基因表达矩阵进行生物信息学分析的第一步,有助于我们观察基因在不同样本中的表达差异,从而确定要研究的基因和表型之间的联系。常用的基因表达数据来自基因芯片或高通量测序。虽然矩阵看起来差不多,但是由于服从不同的分布,因此在进行差异表达的时候需要用不同的方法。对于一般的生命科学领域科研人员来说,了解晦涩的算法并没有太大价值。本文力求精简,从数据——算法——结果三个方面...原创 2018-10-30 23:49:14 · 78865 阅读 · 35 评论