- 博客(16)
- 收藏
- 关注
原创 基因家族分析(1)数据准备及软件安装
进行全基因水平的基因家族鉴定之前,需要准备好一套基因组数据,基因组数据可以从公共数据库下载,也可以根据基因组文献提供的地址到指定网站进行下载。
2023-04-24 22:44:48
1266
原创 为什么要做基因家族(前言)
来源于同一个祖先,由一个基因通过而产生的两个或多个拷贝而构成的一组基因,他们在结构和功能上面具有明显的相似性,编码相似的蛋白质产物。
2023-04-24 21:32:53
370
原创 bulk RNA-Seq (5)差异分析
差异表达分析用于比较两个样本中同一个基因的的表达量是否存在差异。用到的统计方法是假设检验,所以样本需要重复。常用的软件包括DESeq2、edgeR,这里推荐使用trinity软件包的一个程序run_DE_analysis.pl,安装方法:conda install trinity
2023-02-05 16:29:23
995
原创 bulk RNA-Seq (4)合并表达矩阵
上一步定量,我们是对每一个样本进行的,现在需要将它合并到一个矩阵。这里通过一个脚本merge_to_matrix.pl 来合并。
2023-02-05 16:27:46
1059
原创 bulk RNA-Seq (3)表达定量
上一篇推文讲了bulk RNA-Seq 的比对到参考基因组部分,接下来就是基因表达定量了。计算表达定量可以用StringTie、Htseq-cout、featureCounts,这里推荐使用featureCounts。featureCounts 是Rsubread 软件包里的一个命令,所以安装R版本Rsubread的即可。这里使用了一个脚本,在运行featureCounts 的同时,计算FPKM、TPM。
2023-02-05 16:26:18
830
原创 bulk RNA-Seq (2)比对到参考基因组
上一篇推文讲了bulk RNA-Seq 的数据清洗部分,接下来就是将清洗后的数据比对到参考基因组上(有参)。如果没有参考基因组,那么就需要我们自己去组装基因组了。
2023-02-05 16:24:39
914
原创 bulk RNA-Seq (1) 数据清洗
RNA-Seq是技术相对更成熟,应用最广泛,最适合生物信息学人门的方向。bulkRNA-Seq是最普遍的转录组测序方法,所谓bulk就是我们测的是所有细胞的总RNA(mRNA)取平均值代表每个基因的表达量。
2023-02-05 16:22:16
2461
原创 生物学研究与研究思维
抓住事物的本质,排除干扰,做最简单合理的推断,你们就更有可能做出正确的选择和决定。事实上,最简单的、最纯粹的往往才是最深刻的,也是最持久永恒的 ——邵峰院士
2023-02-05 16:18:20
151
原创 生物信息学的发展与未来
今天我们大部分人认为,现代生物信息学是最近出现的,有利于下一代测序数据分析。然而,生物信息学的起源发生在50多年前,当时台式计算机仍然是一个假设,DNA还不能测序。生物信息学的基础是在20世纪60年代初随着计算方法在蛋白质序列分析中的应用(特别是从头序列组装,生物序列数据库和替代模型)而奠定的。后来,DNA分析测序也出现了,因为分子生物学方法的平行进展,这使得DNA及其测序更容易操作,以及计算机科学兴起,以及更适合处理生物信息学任务的新型软件。在 20 世纪 90 年代到 2000 年代,测序技术的重大改进
2023-01-19 18:23:55
2635
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人