- 博客(9)
- 收藏
- 关注
原创 转录组后续分析(继unigene库之后)
必须提供(即.tar.gz文件或解压后的文件夹路径)另外,(官方一般只提供等较高层级数据库)Completecd-hit-est对同一个 Trinity 基因 ID(如 TRINITY_DN43123_c0_g1_i1)有多条不同长度的序列进行重新命名多拷贝基因(D)
2025-11-06 11:17:51
1052
原创 转录组从头组装相关概念
2. Chrysalis(蛹):聚类相似 contigs(相似区域>k - 1 bp ),构建 de Bruijn 图,区分不同 components(组件 );1. Inchworm(虫):将 clean reads 切割为 k - mers(短片段 ),依重叠关系用贪婪算法延伸,生成初始 contigs(连续序列 )。3. Butterfly(蝶):拆分图为线性序列,利用 reads 配对关系消除错误序列,得到最终转录本序列。
2025-10-20 19:58:39
190
原创 用 DESeq2 筛选 DEGs
DEGs 即差异表达基因(Differentially Expressed Genes),DESeq2 是一个专门针对 RNA 测序数据设计的 R 语言包,它采用负二项分布模型来估计基因表达水平的离散性,并鉴定差异表达基因。(1)运行prepDE_fixed.py3,从stringtie的输出中提取基因和转录本的表达计数矩阵(count matrices),运行成功后生成。(transcript count matrix)文件。(2)运行run_DESeq2.R文件,实现。
2025-10-11 22:13:42
389
原创 转录组数据分析笔记
去除接头和低质量序列,减少变异检测(如 SNP calling)的假阳性;:预处理原始 reads,提高后续比对到参考基因组的准确性;(2)使用hisat2将质控后的测序数据比对到指定参考基因组。:提升数据信噪比,保证后续峰识别的可靠。c.sam文件转成bam文件并排序。a.构建指定基因组索引。all. 使用脚本文件批量处理。b.进行单端测序数据比对。
2025-10-11 17:31:23
213
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1