- 博客(10)
- 收藏
- 关注
原创 重复序列的分析
重复序列分析是基因组学中研究基因组中重复DNA序列的重要领域。这些序列分为散在重复序列(如转座子)和串联重复序列(如微卫星)。它们对基因组结构和功能有重大影响,并在进化、遗传和变异中起关键作用。研究方法包括基于同源性和从头预测方法,如RepeatMasker和RepeatModeler。这些分析有助于深入理解基因组复杂性和重复序列在生物进化中的作用。
2024-12-23 21:52:37
1575
原创 新手入门:平均核苷酸一致性分析
FastANI是一个用于计算基因组间平均核苷酸一致性(ANI)的高效工具,支持一对一、一对多和多对多的基因组比较。它通过Conda、二进制文件或源代码编译安装,使用方法简单,输出包括ANI值和片段映射信息,适用于微生物基因组学和系统生物学研究。
2024-12-22 20:35:13
1556
原创 生信入手:CompareM-平均氨基酸一致性(AAI)进行物种鉴定
平均氨基酸一致性(AAI)是评估两个基因组中同源蛋白质序列相似度的关键指标,通过比较相同位置上的氨基酸一致性比例来计算。AAI值越高,表明基因组间的同源性越强,通常意味着它们在进化上更接近。AAI在物种分类、构建进化树和确定微生物物种界限等方面发挥着重要作用。工具如CompareM可用于计算AAI,为比较基因组学提供数据支持。
2024-12-21 21:33:36
613
原创 生信入门:使用blast进行物种鉴定
BLAST是一种强大的生物序列比对工具,用于在蛋白质或DNA数据库中寻找相似性。它包括多种搜索策略,如blastn、blastp等,适用于不同序列类型的比对。BLAST可用于物种鉴定、基因家族成员鉴定以及功能和进化关系的推断。安装BLAST后,可以通过makeblastdb创建数据库,然后使用不同的BLAST工具进行序列比对。BLAST结果的解读主要依据E值、一致性和缺失/插入等指标。对于全基因组数据中难以直接提取的基因,可以利用BLAST建立本地库进行比对,以辅助基因鉴定。
2024-12-20 19:52:25
2639
原创 物种鉴定:Barrnap的使用原理和方法
Barrnap预测rRNA基因的原理是通过搜索基因组序列中的保守rRNA序列来识别rRNA基因。rRNA序列在不同的原核生物中具有高度的保守性,因此可以通过比对已知的rRNA序列来预测新的rRNA基因。通过这些原理和方法,Barrnap能够从基因组序列中快速准确地识别出rRNA基因的位置,支持细菌、古菌、动物线粒体以及真核生物等多种生物类型的rRNA预测。在比对的过程中,Barrnap会计算每个碱基对属于rRNA序列的概率,并根据这些概率来预测rRNA基因的位置。
2024-12-19 16:40:29
506
原创 以BUSCO数据库为参考,评价组装基因组的的完整性。
/run_ascomycota_odb10/busco_sequences:该目录下会记载数据库中比对到的序列,在后面构建系统发育树的时候,基因组质控没问题,但有时跑orthofinder的时候没有出现单拷贝基因,可以通过该目录下单拷贝基因的编号,排除没有共有基因的菌株,重建可以重建构建系统发育树。cat short_summary.specific.ascomycota_odb10.2008.txt | grep 'C:',汇总所有结果,在excel中进行筛选。
2024-12-17 21:08:40
280
转载 二代基因组组装
软件对过滤后Cleaddata进行拼接组装,并筛选出长度≥1000bp的scaffolds作为最终的组装数据。组装完成使用N50,GC含量,BUSCO,QUAST评估基因组的完整性。后续会详细介绍质控的流程。
2024-12-16 19:24:36
157
转载 使用fastp对illumina下机数据进行过滤
二代测序在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记(一般为荧光分子标记)来确定DNA的序列,现有的技术平台主要包括Roche的454 FLX、Illumina的Miseq/Hiseq等。而随着读长增长,基因簇复制的协同性降低,导致碱基测序质量下降,这严格限制了二代测序的读长(不超过500bp),因此,二代测序具有通量高、读长短的特点。质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;
2024-12-16 19:20:30
194
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人