- 博客(50)
- 问答 (1)
- 收藏
- 关注

原创 使用geneHapR进行基因单倍型分析(以vcf文件为例)
如下图所示,可以看到,用户需要准备的包括:基因型文件、注释文件和样本信息文件,以及后续会用的表型文件。输出的主要内容有:变异位点的可视化、单倍型网络、地理分布、表型比较和连锁不平衡热图。geneHapR的工作流程。
2024-04-12 23:41:08
4174
2

原创 Meta-QTL分析的后续流程
此部分内容为《使用BioMercator v.4.2软件进行Meta-QTL分析》的后续操作流程。如前所述,以1号染色体FT性状的Meta-QTL结果为例,预览5个M-QTL的信息如下。可以看到5个M-QTL的遗传位置等信息。
2023-06-08 22:29:31
1147

原创 使用BioMercator v.4.2软件进行Meta-QTL分析
目前,关于Meta-QTL分析的教程网上很少,而对于做正向遗传定位的研究人员来说,使用该方法可以对前人的研究成果加以汇总,同时为其他研究者提供一个方便查询的资源。BioMercator v.4.2软件是进行Meta-QTL分析的常用软件,目前已被多个研究中使用。本文主要叙述如何利用该软件进行Meta-QTL分析。注:使用该软件需事先在电脑上完成Java环境的配置,以使软件能正常运行。
2023-06-08 00:08:33
3261
23
原创 ASEG的鉴定
**启动子序列比较**:使用NUCmer等工具比较杂交种及其亲本的启动子区域序列,识别插入/缺失(InDels)和单核苷酸多态性(SNPs)。- **处理条件**:在不同环境条件下(如光照、温度、水分等)培养样本,以研究ASE基因在不同条件下的表达差异。- **综合分析**:结合转录组、表观遗传和基因组数据,综合分析ASE基因的调控机制及其在杂种优势中的作用。- **qPCR验证**:使用定量实时PCR(qPCR)验证ASE基因的表达模式,确保鉴定结果的准确性。
2025-04-11 23:34:23
79
原创 基于GFF3文件提取基因的位置信息
GFF3文件是一种常用的基因组注释文件格式,用于描述生物基因组的结构和功能元素。GFF3是“General Feature Format Version 3”的缩写,它由一系列字段组成,每个字段描述基因组中的特定特征,如基因、转录本、外显子等。这些字段包括:序列名称、特征类型、起始位置、终止位置、分数、方向、相位、分组以及属性信息等。GFF3文件通常用于存储和交换生物信息学数据,在生物信息学研究中广泛应用于基因组注释、基因组比较和功能预测等领域。
2025-02-16 00:05:50
229
原创 利用R计算一般配合力(GCA)和特殊配合力(SCA)
在遗传育种和数量遗传学中,Sommer包可以用于分析和估计一般配合力(GCA)和特殊配合力(SCA),尤其是在杂交育种和基因组选择的背景下。
2025-01-19 22:53:04
532
1
原创 基因结构图绘制(Exon-Intron Graphic Maker)
Exon-Intron Graphic Maker是一个用于创建外显子-内含子图形的工具。外显子和内含子是基因的两个重要组成部分,外显子是基因中编码蛋白质的部分,而内含子是基因中非编码的部分。该工具可以帮助研究人员和生物学家可视化基因的外显子和内含子的分布情况。它提供了一个直观的图形界面,用户可以通过简单的拖放和编辑操作来创建外显子-内含子图形。用户可以添加基因的外显子和内含子序列,并根据需要对其进行编辑和调整。工具还提供了多种绘图选项,用户可以自定义图形的样式、颜色和标签。
2025-01-13 10:14:06
575
原创 使用R包Corrplot绘制相关性图
使用corrplot包,用户可以创建不同类型的相关性图,包括颜色映射、点图、数字矩阵等。这可以帮助用户更好地理解数据集中的变量之间的相关性。R包Corrplot是一个用于可视化相关性矩阵的R语言包。它提供了各种方法来显示相关性矩阵,并允许用户根据需要进行自定义调整。该包还提供了各种选项和参数,以便用户根据需要自定义图形。这包括调整相关性矩阵的颜色、标签、标题、字体等。
2025-01-09 22:43:18
533
原创 PCA分析及Biplot绘制确定不同性状指标的权重
在进行表型鉴定的过程中,我们常常会鉴定多种指标。例如,在进行逆境胁迫研究时,我们会测量胁迫前后的植株的形态学和生理学等指标,以反映植物的受损程度或者耐逆能力。以玉米为例,植株收到逆境胁迫后,可能表现出植株矮小、生物量和产量下降以及光合作用等能力降低的现象,进而我们会去测定株高、生物量、单株产量、SPAD值等指标。那么,在这些众多指标中,到底哪一个或哪几种可以反应植株的受损程度还需要我们进行一个深入分析,其中PCA分析和Biplot的绘制可以帮助我们较好地了解这些指标的比重,以更好地进行后续的试验和分析。
2024-11-10 15:40:15
595
原创 eQTL分析-1(表型数据处理)
eQTL分析是基因组学研究中的一种方法,用于识别影响基因表达的遗传变异,从而揭示基因调控的遗传基础。1. **基因表达数据的获取**:通过高通量测序技术(如RNA-seq)或微阵列技术,获得个体或样本的基因表达数据。2. **遗传变异数据的获取**:通过全基因组关联研究(GWAS)或测序,获得个体或样本的遗传变异数据。3. **统计分析**:利用统计学方法,分析基因表达水平与遗传变异之间的关联。4. **eQTL定位**:识别出与特定基因表达水平显著相关的遗传变异位点。
2024-09-30 10:46:34
753
原创 BCFtools安装
记得之前安装这个软件的时候是非常简单的,但是今天重新安装的时候出现了很多的麻烦,想想还是做个记录吧!然后,再重新运行make和make install,成功安装!打开Linux系统,键入以下命令进行下载。此时遇到了报错, 分别是下面这几个。这里我们选用的是1.2版本,即为最新版。查询了AI,使用以下代码可以完美解决。之后进入文件夹中,进行编译安装。下载完成后,解压文件。
2024-07-01 11:06:41
964
原创 推荐两个植物miRNA数据库(miRbase和PNRD)
植物miRNA数据库是储存和整理植物微小RNA(miRNA)相关信息的数据库。miRNA是一类长度为21-24个核苷酸的非编码小分子RNA,能够通过与靶基因的mRNA结合,调控基因表达。植物miRNA数据库通常包含以下内容:miRNA序列信息:数据库中储存了已知的植物miRNA序列信息,可以通过搜索或浏览功能查找感兴趣的miRNA。靶基因预测:数据库通过预测和分析miRNA与靶基因的互作关系,提供了植物miRNA靶基因的预测结果。这些预测结果可以帮助研究者了解miRNA的功能和调控机制。
2024-04-13 20:20:42
2090
1
原创 使用TASSEL5进行候选基因关联分析
候选基因关联分析是GWAS分析流程的重要步骤,同时也是确定候选基因有效变异位置的重要途径,本文主要介绍如何使用TASSEL5进行候选基因关联分析。简要介绍如下:TASSEL5是一个用于进行候选基因关联分析的软件工具。候选基因关联分析(Candidate gene association analysis)是一种寻找基因与特定表型关联的方法。该方法通过先验知识或基因功能的研究,选择一组候选基因,并研究这些基因与表型之间的关系。
2024-04-06 23:40:09
2607
1
原创 使用PopLDdecay软件绘制LD衰减图
PopLDdecay是一款用于进行种群遗传学和关联分析的软件。它可以在全基因组水平上进行基因型数据的相关性和衰减分析,帮助研究人员探索种群间的遗传差异和突变选择的模式。PopLDdecay支持多种数据格式的输入,包括VCF、HapMap、PLINK和BEAGLE等格式。它还提供了直观的可视化功能,可以生成遗传距离和衰减图,帮助用户更好地理解和解释结果。此外,PopLDdecay还具有高效的计算能力和并行处理功能,可以加快分析速度,提高效率。
2024-03-29 23:55:34
2814
1
原创 使用MG2C绘制基因染色体位置图
MG2C(MapGene2Chrom)是由中国农业科学院烟草研究所烟草功能基因组创新团队开发的一款遗传图谱在线画图工具。这个工具旨在简化遗传图谱的绘制过程,使得科研人员无需编程基础也能轻松创建展示分子标记在染色体或基因组上相对位置的图谱。MG2C提供了一个用户友好的界面,用户只需根据提供的EXCEL数据模板准备相关信息,如基因位置、染色体长度等,然后将这些数据复制到MG2C的文本框中,点击“DRAW”按钮即可生成结果。此外,MG2C支持多种文件格式下载,包括JPG、PNG、TIFF和SVG等。
2024-03-28 20:06:25
1889
4
原创 植物miRNA数据库PmiREN2.0的使用
PmiREN(Plant miRNA ENcyclopedia)是一个全面的植物 miRNA 功能数据库。在 2.0 版中,它包含了从叶绿体到被子植物的 179 个物种的 38,186 个 miRNA 位点(MIR),隶属于 7,838 个科、1,668 个同源区块和 141,327 对预测的 miRNA-靶标。此外,2331 个深度测序的小 RNA 文库被用于量化 miRNA 表达模式,116 个 PARE-Seq 文库被用于验证预测的 miRNA 对。
2024-03-15 21:37:22
1296
原创 玉米基因miRNA结合位点预测工具
打开官网后,如下所示:psRNATarget是一个在线工具,用于预测植物小RNA和宿主基因的互作关系。它基于植物小RNA和宿主基因的序列数据,使用一个准确的算法进行分析和预测。用户可以输入小RNA和宿主基因的序列,或者直接上传相应的FASTA文件。该页面会显示预测结果,包括小RNA的靶向位点,以及宿主基因的功能注释和调控网络。用户还可以进行进一步分析,例如查看小RNA和宿主基因的共表达网络,以及预测小RNA的调控效应。
2024-02-09 16:41:04
1820
1
原创 使用IGV软件可视化染色质可及性
染色质可及性(chromatin accessibility)是指DNA序列在植物细胞核中的可访问程度。染色质是由DNA和蛋白质组成的复杂结构,它紧密地包裹在细胞核中,并影响基因的表达和功能。染色质可及性研究着重于理解染色质是否容易被转录因子和其他调控蛋白访问,从而影响基因的表达。文献中,常常会有下面这种图片来表示基因组上的一些区域或基因的染色质开放性强弱。一般情况下,我们可以使用IGV软件或GSA-man软件进行可视化,两者的操作相似。这里,以IGV软件为例,演示如何对染色质可及性进行可视化。
2024-02-07 18:55:49
2732
原创 植物中的uORF简述
uORF在植物中具有广泛的功能,包括对基因表达的调控、应对各种胁迫、参与发育过程等。uORF通常位于基因组的起始编码子(ATG)上游区域。uORF指的是"upstream open reading frame",它是指与主要翻译产物一起由同一个mRNA分子编码的另一条ORF。uORF的存在可能会影响主要ORF的翻译起始位点和速率,从而影响基因表达。以下是对植物中uORF功能的简述。调控基因表达:植物中的uORF可以通过抑制CDS的翻译来调节基因表达。
2023-09-24 23:11:27
3286
原创 基因编辑载体的构建(以玉米为例)
基因编辑载体构建的主要步骤如下:选择CRISPR/Cas9系统:选择合适的CRISPR/Cas9系统并确定需要编辑的基因靶点。选择载体:选择合适的载体,通常是质粒或病毒载体,以便将CRISPR/Cas9系统导入细胞。克隆CRISPR/Cas9组件:将用于编码Cas9蛋白质和sgRNA序列的DNA片段克隆到载体中。通常情况下,这涉及到PCR扩增并克隆到适当的限制酶切位点上。双重检测:使用序列检测和限制酶酶切测序来验证克隆的正确性。导入细胞:使用合适的方法,将构建好的载体导入需要编辑的目标细胞中。
2023-09-15 21:57:16
1835
2
原创 RNA-seq分析:Step10(Cytoscape制作蛋白质互作网络及寻找核心基因)
Cytoscape是一个生物信息学工具,用于可视化和分析分子相互作用网络。在Cytoscape软件中,输入的edges文件指的是连接节点的边缘信息,该文件包含了所有边缘的起始节点和终止节点的信息。通过同时导入edges和nodes文件,Cytoscape可以生成一个可视化的网络图,其中所有节点和边缘的属性信息可以根据需要进行调整和编辑。在寻找核心基因时,我们可以利用Cytoscape提供的网络分析工具,如度中心性、介数中心性、紧密度等指标,来计算网络中各节点的重要性,并筛选出具有重要作用的核心基因。
2023-09-09 22:33:14
2604
4
原创 RNA-seq分析:Step9(共表达分析)
WGCNA(Weighted Correlation Network Analysis)是一种系统生物学中常用的数据分析方法,主要用于分析高通量基因表达数据。该方法通过构建基因共表达网络,将相似的基因组织到同一模块中,并用模块间的关联性进行分析,从而识别与生物学过程相关的模块和关键基因。WGCNA分析流程主要包括:数据预处理、构建共表达网络、模块检测、模块注释和功能分析等步骤。
2023-08-30 11:05:32
1896
原创 RNA-seq分析:Step8(富集分析)
RNA-seq富集分析是一种用于分析基因表达数据中特定基因或通路是否富集的分析方法。其基本思想是比较不同基因对应的转录本/基因之间的表达差异及其对应的基因注释信息,通过统计学方法评估差异的显著性,从而确定是否存在某些特定的功能通路或基因集合富集的情况。常用的RNA-seq富集分析工具包括GOseq、KEGG(KEGG enrichment analysis)、DAVID(Database for Annotation, Visualization and Integrated Discovery)等。这
2023-08-28 18:06:06
2938
原创 RNA-seq分析:Step7(差异表达分析)
RNA-seq是一种高通量测序技术,可以对转录组进行全面、高灵敏度的分析。差异表达分析是RNA-seq数据分析中常用的方法之一,用于识别不同条件下基因表达水平的差异。差异表达分析一般包括数据预处理、基因表达计数、表达矩阵构建、差异分析、基因功能注释等步骤。在差异分析中会使用一些常见的统计方法,如DESeq2、edgeR等,通过比较不同样本之间的基因表达数目或含量,筛选出差异表达基因,并进行生物学功能注释和通路分析,以探究不同条件下基因表达的差异及其可能的生物学影响。
2023-08-26 17:47:47
2889
4
原创 RNAseq分析:Step6(计算表达丰度)
RNA-seq技术是研究基因表达的常用方法之一,其表达丰度计算是RNA-seq数据分析的重要步骤之一。RNA-seq表达丰度计算的基本流程如下:序列比对:将测序数据比对到参考基因组,得到每个基因的计数。转录本重构:使用转录本拼接软件,如Cufflinks或StringTie,将比对后的 Bam/Sam 文件转换为每个转录本的表达值。这里的转录本可能是已知的基因、未知的基因或转录本。表达值的归一化:考虑样本间的技术差异和表达量大小的影响,对表达值进行归一化。
2023-08-24 11:16:55
1991
原创 RNA-seq分析:Step5(拼接)
转录本拼接是指将同一个基因产生的不同转录本进行合并,形成一个完整的基因序列。转录本拼接主要应用于RNA-Seq数据分析中,对基因组注释的完善以及发现未知的基因和转录本具有重要意义。在进行转录本拼接时,首先需要将原始的RNA-Seq数据进行清洗和过滤,去除低质量的序列和污染物。接着,利用特定的拼接软件对清洗后的序列进行处理,根据同源性、跨越剪切和外显子连接等特征,将不同的转录本进行合并。常用的拼接软件包括Cufflinks、StringTie和Trinity等。
2023-08-23 10:24:08
1440
3
原创 RNA-seq分析:Step4(比对)
预处理之后的fastq文件,可以使用HISAT2软件将reads比对至参考基因组上。HISAT2软件将reads比对至参考基因组上的步骤如下:1. 对参考基因组进行建索引。对参考基因组进行预处理,生成索引文件,包括基因组序列的FM索引和SA索引。2. 将原始的reads进行预处理。包括去除接头序列、去除低质量的碱基,以及进行过滤,得到质量较高的、可靠的reads。3. 利用建立的FM索引和SA索引,将处理后的reads与参考基因组进行比对。首先,通过FM索引,快速找到与reads匹配的可能位置;
2023-08-22 22:48:09
1936
原创 RNA-seq分析:Step3(数据预处理)
RNA-seq是一种高通量基因表达分析技术,常用于研究生物体内基因表达的变化。在进行RNA-seq之前,需要进行预处理工作以优化实验结果。预处理包括:1)样本质量控制,包括检验RNA完整性和纯度;2)RNA文库制备,包括选择RNA样本、RNA转录成cDNA、文库构建等;3)测序平台选择,包括Illumina、IonTorrent等;4)数据质量控制,包括去除低质量序列、去除接头序列、过滤低复杂度序列等;5)比对和定量,包括将测序序列映射到参考基因组、计算基因表达量等。预处理的好坏直接影响后续分析结果的可靠性
2023-08-21 16:30:18
3286
原创 RNA-seq分析:Step2(数据的下载)
转录组测序原始文件和基因组数据的下载是进行转录组分析的重要步骤,本文中,以拟南芥的RNA-seq数据为例子,进行RNA原始测序数据的下载和基因组文件的下载。
2023-08-20 20:20:09
3801
原创 RNA-seq分析:Step1(软件的安装及配置)
好几个月没有跑RNA-seq分析了,为防止遗忘,特整理分析流程于转录组分析专栏。RNA-seq分析是生信分析流程比较入门的操作,常规的分析主要包括差异基因表达分析、GO和KEGG分析和WGCNA分析。一般来说,前两个分析是最为常见的,第三个主要存在于纯转录组分析文章中。本文主要讲述转录组分析的第一步,软件的安装和配置。
2023-08-19 20:26:41
3198
2
原创 Linux环境下Miniconda3的安装和使用
Conda是一款在Linux中安装程序的软件,类似于Windows中的应用商店。在Linux系统中,使用conda可以方便的进行软件的安装和环境配置。具体详见以下链接:Anaconda系列:conda是什么?conda与pip的区别是什么?_zhanghai4155的博客-优快云博客本文主要讲述如何在Ubuntu系统中安装和使用Conda,以Miniconda3为例。
2023-08-17 15:05:21
15319
原创 Windows10下安装VMware16虚拟机
由于本人系统为Windows 10 家庭中文版,无法安装Linux子系统WSL,虽然网上也有强制安装的方法,但为保险起见,还是把之前的VMware虚拟机重新进行安装,并浅浅记录一下安装过程。
2023-08-16 18:32:52
518
原创 《使用R包ggtree进行进化树的绘制与美化》
都2023年了,才去使用Y叔早在2018年发表的进化树构建利器——ggtree。刚好最近在做基因家族分析,进化树的构建与美化确实有点麻烦,先前使用MEGA11进行了绘制,但图像简陋,于是导出了nwk文件,准备使用其他软件进行美化。这里,我使用ggtree包进行操作。
2023-08-14 18:31:45
5820
原创 R和Rstudio中包的安装、加载和查看等操作
前言R语言中,R包的安装和加载等操作是使用R包进行数据分析和绘图的基础,尤其是对于R语言初学者具有重要的意义。下面主要介绍一些R包的常用操作命令。
2023-06-27 09:57:06
8539
原创 MapChart2.32的安装和使用
MapChart是一款用来可视化遗传图谱和QTL的软件,在QTL定位研究中被经常使用,有助于科研人员直观地了解遗传图谱和QTL的相关信息。下面对该软件的安装和使用做简单介绍,并以其中的示例文件介绍其使用的相关细节。
2023-06-12 23:06:33
3349
4
原创 生物信息学专业期刊介绍
Journal of Integrative Bioinformatics 影响因子0.000分,是几区,2021-2022年期刊投稿经验分享,Journal of Integrative Bioinformatics主页,推荐审稿人、编辑,审稿周期/时间,版面费多少,中国作者发表文章,修改意见 (letpub.com.cn)生物信息学是现今热门的研究发现,现介绍几个专门的期刊,供大家参考。
2023-06-11 13:39:06
671
原创 R、Rstudio和Rtools的安装(以4.3.0版本为例)
这里下载的是4.3.0版本,选择Windows版本,下载后选择路径进行安装,默认选项即可。选择Windows10版本进行安装。
2023-05-09 10:32:07
7759
2
Cytoscape3.7.1安装包
2023-09-09
GWAS分析软件GAPIT使用说明
2023-08-28
bcftools进行SNP calling报错
2023-04-13
Rstudio中设置文件列名报错显示rownames重复,如何解决?(语言-r语言)
2022-11-11
Linux服务器无root权限如何安装Rstudio?(操作系统-linux)
2022-11-04
转录组分析进行stringtie拼接报错如下,如何解决?(操作系统-linux)
2022-11-03
Liunx系统下Hisat2进行比对时报错如下,如何解决?(操作系统-linux)
2022-10-26
求BioMercator V4 软件的下载链接。jar文件如何用Windows打开?
2022-02-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人