
数据分析
文章平均质量分 56
荞麦agan
2014年开始从事高通量测序与生物信息学相关的学习及工作。
展开
-
毒液蛋白质相互作用分析
毒液蛋白质相互作用分析简介蛋白质间相互作用是生命现象发生的基础,研究其相互作用可以阐明生物反应的机理,揭示生命现象的本质。虽然有一些蛋白可以以单体的形式发挥作用,但是大部分的蛋白都是通过蛋白间相互作用或形成蛋白复合物来发挥作用的。近年来,研究分子相互作用的技术不断出现。通过生物信息学的方法对大量毒液蛋白在生物系统中的相互作用关系进行系统分析,对了解生物系统中毒液蛋白质的工作原理,毒液蛋白的致病机理以及中毒等特殊生理状态下生物体生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。在生原创 2022-03-02 16:35:13 · 464 阅读 · 0 评论 -
毒液组学-多组学关联分析大全
(一)转录组学与蛋白组学联合分析1.1 简介转录组是特定发育阶段或生理条件下细胞内的完整转录信息的集合,代表了基因表达的中间状态。转录组测序可以对所有转录物进行分类、确定基因的转录结构、量化转录物的表达水平。其含量的变化在生物体的生长、环境应激、疾病发生发展等过程中发挥着重要的作用。且从DNA、mRNA到蛋白质的过程中涉及到一整套精细的表达调控机制,如转录调控、转录后调控、翻译调控、翻译后调控等。因此,要全面探究毒液的组成,致病机理,生物学活性和药理作用,同步检测mRNA和蛋白质的表达量并进行联合分析已原创 2021-07-03 11:34:25 · 1941 阅读 · 0 评论 -
(一)外显子组数据分析之软件安装大全
软件安装备注:一些常用,好安装的软件尽量自己手动安装,对于一些比较复杂的软件,可以用conda安装管理。此外,由于是刚刚使用的服务器,所以,需要安装许多基础软件。## 安装condawget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh #更改镜像配置conda config --add channels https://mirrors.tuna.tsinghua.原创 2021-06-16 13:39:44 · 647 阅读 · 0 评论 -
生物软件安装出现: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.的解决办法
本人系统:阿里云服务器的Linux安装好conda后,准备用conda开始安装软件,然后,在输入命令,报错~# conda create -n wes python=2 bwaCollecting package metadata (current_repodata.json): failedCondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/c原创 2021-06-10 11:11:33 · 1059 阅读 · 0 评论 -
宏基因组学数据分析在生物医学领域的应用
简介宏基因组学研究是以特定生境中的整个微生物群落作为研究对象,无需分离培养,直接提取环境样本DNA进行测序,研究环境微生物的群落结构、物种分类、系统进化、基因功能及代谢网络等,已广泛应用于微生物领域。宏基因组学研究与传统微生物研究方式的最大区别在于把微生物看成一个整体, 摆脱了对单个微生物培养和分离的步骤,直接对环境中所有的微生物进行研究,进而可以全面地对所有微生物进行分析。如针对长期、反复腹泻的病人,可能原因是肠道生态系统失调导致的消化道炎症或者特定的病毒或者微生物感染。通过对病人粪便进行宏基因组测序分原创 2021-05-31 15:12:04 · 1437 阅读 · 0 评论 -
蛋白质组学数据分析在生物医学领域的应用
简介蛋白质组学(Proteomics)是研究细胞、组织或生物体中蛋白质组成、定位、变化及其相互作用规律的科学,包括对蛋白质表达模式和蛋白质组功能模式的研究。对不同患病个体,特定表型以及正常样本的蛋白质组学数据进行研究分析,对寻找疾病的诊断标志、筛选药物靶点、毒理学研究等有重要意义。因此,根据不同的研究目的,不同的蛋白质组学研究技术被广泛应用于医学研究。蛋白质组学数据分析的意义蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体原创 2021-05-27 15:32:18 · 1554 阅读 · 0 评论 -
基因组数据分析在生物医学领域的应用
简介基因组是指一个生物体的一套染色体中的完整的DNA序列。20世纪90年代初,“人类基因组计划”正式启动,开启人类在分子水平上认识自身遗传密码的新航程。2001年,人类基因组精细图谱及其初步分析结果发布,揭开了由ATCG四种符号组成的人类遗传密码的真实面貌。通过生物信息学的方法对基因组信息进行挖掘对于鉴定遗传性疾病、表征驱动癌症进展的突变和追踪疾病爆发极为重要。快速下降的测序成本以及生物信息技术的发展,使得人类基因组研究相关的一系列性技术出现。如基因检测,基因诊断、基因治疗、靶向药物等医学新手段。生物医学原创 2021-05-26 14:24:59 · 2003 阅读 · 1 评论 -
转录组数据分析在生物医学领域的应用
简介随着第二代测序技术的迅猛发展,其高通量、快速、低成本的特点成为越来越多的生物学研究者在解决生物学问题时的首选,尤其在转录组测序方面更显示出极大的潜力。转录组测序(RNA-Seq)作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。转录组(transcriptome)是指特定生物体在某种状态下所有基因转录产物的总和,转录组研究是功能基因组研究的一项重要内容。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA 反转录而成cDNA文库进行测序,通过统计相关读段(reads)数计算出不同原创 2021-05-25 15:25:05 · 3233 阅读 · 1 评论 -
基因分型分析
研究人员能够利用基因分型来研究遗传变异,例如单核苷酸多态性(SNP)和较大的DNA结构变化。新一代测序(NGS)和芯片等高通量基因组技术能让研究人员在分子水平上更深入地了解疾病病因。由于能引起疾病的基因组靶点可能有很多个,因此分析需要灵活性和准确性。SNP基因分型和拷贝数变异(CNV)数据分析工具可以分析数百万个标记和探针的结果,并检测样本离群值,预测基因变异的功能性后果。...原创 2021-05-19 15:15:37 · 2323 阅读 · 0 评论 -
基因分型分析之全外显子组分析
简介全外显子组测序是一种广泛使用的新一代测序(NGS)方法,涉及基因组蛋白质编码区域的测序。人类外显子组所占基因组的比例不超过2%,但它包含了约85%已知与疾病相关的变异,这使得该方法成为全基因组测序的一种经济高效的替代方法。外显子组测序可检出编码外显子的变异,能够扩大靶向内容,包括非翻译区(UTR)和microRNA,可以获得基因调控的全面视图。当无法进行或没有必要进行全基因组测序时,外显子组测序是一种经济有效的替代方法。只对基因组的编码区域进行测序,使研究人员能将资源集中在最有可能影响表型的基因上,周原创 2021-05-18 15:22:21 · 5283 阅读 · 2 评论 -
全基因组多位点序列分型
简介多位点序列分型(multilocus sequence typing, MLST)是一种基于核酸序列测定的细菌分型方法。这种方法通过PCR扩增多个管家基因内部片段并测定其序列,分析菌株的变异。MLST操作简单,结果能快速得到并且便于不同实验室的比较,已经用于多种细菌的流行病学监测和进化研究。随着测序速度的加快和成本的降低,以及分析软件的发展,MLST逐渐成为细菌的常规分型方法。随着二代测序技术提供了快速、经济高效的细菌基因组测序方法,以及分析软件的发展,全基因组多位点序列分型(wgMLST)技术逐渐取原创 2021-05-14 15:31:58 · 2215 阅读 · 0 评论 -
生物医学数据统计分析-回归分析
简介回归分析是通过一定的数学表达式描述变量之间的数量变化关系,并进行预测。回归分析分为:一元线性回归分析,多元线性回归分析,非线性回归分析,曲线估计,时间序列的曲线估计等模型。回归分析和相关分析都是研究变量间关系的统计学分析方法,在回归分析中,变量Y成为因变量,自变量X可以是随机变量;而相关性分析中,X,Y都是随机变量。常见的回归分析方法有直线回归,多重线性回归,Logistic回归等。回归模型的选用直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归原创 2021-05-13 09:58:59 · 1288 阅读 · 0 评论 -
生物统计分析之生存分析
简介生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。临床医学数据生存分析是将临床医学中事件的现象与结果(终点事件)和出现临床现象与结果经历的时间结合起来分析的一种统计分析方法。生存分析的目的1.描述生存过程:预测不同时间的总体生存率、计算中位生存期、绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。2.比较研究结果:比较不同处原创 2021-05-13 09:55:21 · 1531 阅读 · 0 评论 -
生物统计分析之机器学习
简介机器学习的定义为“一个计算机程序通过执行一些任务T得到评价P,从而得到经验E,如果程序能通过任务T和评价P得到更好的经验 E,那么我们就学这个程序进行了机器学习。” 机器学习是否有效往往取决于数据的多少,以及数据的质量。大量高质量的数据可以产生更好的结果。随着医疗行业的发展,产生了大量的临床数据和科学研究数据。大数据和机器学习基于更好的决策,优化后的创新的特点,大大的提高了医生或者科研人员的科学研究和临床试验工作效率。通过对研发部门,医生和诊所,病人,护理人员等记录的临床或者科研数据进行收集,利用机器原创 2021-05-11 15:20:22 · 771 阅读 · 0 评论 -
生物统计分析之ROC曲线分析
简介受试者工作特征曲线( receiver operating characteristic curve , ROC 曲线),又称为感受性曲线( sensitivity curve ),是比较诊断测试的一种方法。随着接受者灵敏度的提高,假阳性的数量会随之增加。 因此, ROC 曲线实际上反映了特异性与灵敏度的关系,它是真阳性率与假阳性率的关系图。其背后的逻辑是,如果一项测试没有诊断能力,那么它产生真阳性或假阳性的可能性是相同的。随着诊断能力的增加,即特异性的提升,真阳性率上升,假阳性下降。 在临床诊断中R原创 2021-05-10 15:31:19 · 7361 阅读 · 0 评论 -
生物统计分析之主成分分析(PCA)
简介在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。主成分分析是多变量分析方法中的一种分析方法,常见的多变量分析方法还包括多变量方差分析(Multivariate analysis of variance,MANOVA)、因子分析(Factor analysis)、典型相关(Canonical correlation analysis)、以及聚类分析(Cluster原创 2021-05-08 13:37:55 · 4411 阅读 · 0 评论 -
统计分析之聚类分析
简介聚类分析,是一种将随机现象归类的统计学分析方法,在不知道应分为多少类合适的情况下,试图借助数理统计的方法用已收集到的资料找出研究对象的适当归类方法。在生物医学之中,聚类分析已成为发掘海量信息(包括基因信息)的首选工具。聚类分析数据探索性统计分析方法,按照分类的目的可以分为R型聚类和Q型聚类。R型聚类又称为指标聚类,是指将m个指标归类的方法,其目的是将指标降维从而选择有代表性的指标,是针对变量进行的聚类分析。Q型聚类又称样品聚类,是指将n个样品归类的方法,其目的是找出样品间的共性,是针对样本的聚类分析。原创 2021-05-06 15:09:19 · 3147 阅读 · 0 评论 -
生物医学数据统计分析-相关性分析
相关性分析的概念相关性是一个统计学名词,相关的定义为随机变量之间相互联系的密切程度和方向。在医学研究中,探讨某疾病的发生与哪些因素有关、疾病与疾病之间的关系等,都需要用到相关性分析,它常用于判断两个数值变量之间有无线性关系、相关性的方向和相关性的强弱。在相关分析中,所有变量都是随机变量,它们之间不存在被解释变量和解释变量之间的关系。相关性分析有简单和多元相关,线性相关和非线性相关,正相关和负相关的关系。常用的相关性分析检验方法有线性相关分析法,Pearson 相关分析法,Spearman相关分析法,秩相关原创 2021-04-30 14:58:50 · 3581 阅读 · 0 评论 -
生物医学数据统计分析-分类资料统计分析
简介临床医生或者研究人员往往在分类资料分析时统计具有某种属性的个体数,调查或科研中清点分类变量资料所得到的数据称之为绝对数。绝对数可以反映研究事物或现象的基本信息,但是不便于相互比较和寻找事物间的内在联系,因此,常常使用相对数(relative number)如率,构成比,相对比等来描述和比较这类资料。 分类变量分为无序分类和有序分类,无序分类包括二项分类和多项分类,如计数资料;有序分类指变量之间有程度的差别,且排列有序,如等级资料。根据不同的资料类型,选用不用的统计分析方法,如Pearson卡方检验,W原创 2021-04-30 09:52:33 · 1677 阅读 · 0 评论 -
生物医学数据统计分析-两组或多组计量资料的比较
简介在临床或者基础医学研究中,会对不同的数据资料进行数据记录,其中,计量资料指连续的数据,通常有具体的数值,如临床上的身高、体重、血压、血红蛋白、胆红素和白蛋白等。以及基础医学研究中比较患者和正常人的血清铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等。针对不同的数据类型采取不同的统计分析方法,如t检验,秩和检验等。t检验,亦称student t检验(Student’s t test),主要用于样本含量较小,且分布符合正态分布的样本。t检验是用t分布理论来推论差异发生的概率,从原创 2021-04-28 16:22:43 · 6304 阅读 · 0 评论 -
传染病研究-靶向下一代宏基因组测序(mNGS)分析
简介在临床检测实验室,临床样品中病原体常规检测的范围包括鉴定培养中的微生物,如通过生化表型检测或基质辅助激光解吸/电离(MALDI)飞行时间质谱法,以及检测生物体特异性生物标记物,如抗原用乳胶凝集试验或酶联免疫吸附试验(ELISA)抗体试验,或用PCR对单个样本进行核酸试验。但是通过这些检测方式一次只能检测一种或有限的病原体。通过靶向下一代宏基因组测序有针对性的检测方法有利于增加序列数据中病原体读取的数量和比例,可以提高对目标微生物的检测灵敏度。靶向NGS分析的方法有: 1. 使用高度保守的引物对临床样原创 2021-04-22 10:29:36 · 2452 阅读 · 0 评论 -
带你初步了解基因表达调控
简介基因表达调控机制是后基因组时代一个重要的研究内容。基因正确的表达有赖于一个复杂的调控系统而转录因子与转录因子结合部位的相互作用是这一系统的重要组成部分。不同的转录因子对外界环境的各种刺激或不同发育阶段的各种信号做出反应,结合于转录调控元件,激活或抑制基因的转录从而控制不同基因的表达。因此,进行基因表达调控研究需要确定基因组序列中的转录因子结合部位。随着基因组序列信息的日益丰富,计算方法和数据库的不断完善,生物信息学的应用将日益广泛,生物转录调控机制也将逐步得到阐明。...原创 2021-04-19 09:27:26 · 5301 阅读 · 1 评论 -
基因调控分析之转录因子结合位点分析
简介基因表达调控机制是后基因组时代一个重要的研究内容。其中,转录因子通过特异性结合调控区域的DNA序列来调控基因转录过程。转录因子(Transcription Factors,TFs),是指能够以特定序列与基因专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。许多转录因子充当着主调节因子和选择基因的角色,控制着细胞类型的决定、发育模式和特定途径控制(如免疫反应)的过程。转录因子结合位点(Trans原创 2021-04-14 14:56:37 · 5815 阅读 · 0 评论 -
蛋白质翻译后修饰分析简介
蛋白质翻译后修饰蛋白质翻译后修饰 (Protein post-translational modifications,PTMs) 通过功能基团或蛋白质的共价添加、调节亚基的蛋白水解切割或整个蛋白质的降解来增加蛋白质的功能多样性。蛋白质组中任一蛋白质都能在翻译时或翻译后进行修饰。不同类型的修饰都会影响蛋白质的电荷状态、疏水性、构象或稳定性,最终影响其功能。这些修饰包括磷酸化、糖基化、泛素化、亚硝基化、甲基化、乙酰化、脂质化和蛋白水解。相较于没有发生修饰的蛋白,PTMs会导致特定序列分子量的增加。在蛋白翻译后原创 2021-04-13 13:39:47 · 8649 阅读 · 0 评论 -
甲基化调控分析
简介甲基化(methylation)为DNA化学修饰的一种形式,是蛋白质和核酸的一种重要的修饰。能够在不改变DNA序列的前提下,能够调节基因的表达和关闭,改变遗传表现。与癌症、衰老、老年痴呆等许多疾病的发生密切相关,是表观遗传学的重要研究内容之一。而DNA甲基化是DNA化学修饰的一种形式,是DNA序列上特定的碱基在DNA甲基转移酶(DNMT)的催化作用下,以S-腺苷甲硫氨酸(SAM)作为甲基供体,通过共价结合的方式获得一个甲基基团的化学修饰过程。大量研究表明,DNA甲基化能引起染色质结构、DNA构象、DN原创 2021-04-12 14:22:28 · 570 阅读 · 0 评论 -
代谢网络分析
简介代谢处于生命活动调控的末端,是驱动生命过程的化学引擎,产生能量来驱动各种细胞过程,降解和合成许多不同的分子。代谢网络把细胞内所有生化反应表示为一个网络,反映了所以参与代谢过程的化合物之间以及所有催化酶之间的相互作用,是对细胞代谢的抽象表达。研究代谢网络能帮助我们更好地认识和利用细胞代谢过程,从而促进疾病基础研究,药物开发等方向的发展。另一方面,网络的拓扑结构是网络形成和进化的反映,研究代谢网络的结构特征,能帮助我们认识代谢网络的形成演化机理,从而更好地理解疾病发生发展过程以及生命进化过程。应用领域原创 2021-04-10 15:44:04 · 2220 阅读 · 0 评论 -
带你初步了解生物网络分析
简介生物网络是复杂网络,也是以系统科学的思想研究生命的桥梁。网络中的节点可以是蛋白质,基因,RNA,DNA以及代谢物等,网络的边对应节点之间的物理、生化或功能上的相互作用。生物分子之间的相互作用并不是一成不变的,反应在基因调控网络上,节点之间的边会因时间、空间或外部环境的变化而发生变化。网络分析是生物网络的研究重点。网络中生物分子及其相互作用的显著变化,形成差异性网络,这种差异性变化对细胞信号传导、细胞发育、环境压力、药物治疗以及疾病状态的转变有重大的参考价值。目前常见的网络分析有基因调控网络,蛋白质相互原创 2021-04-09 16:12:03 · 2531 阅读 · 0 评论 -
单细胞调控网路分析
简介组织内细胞异质性的基础是细胞转录状态的差异,转录状态的特异性又是由转录因子主导的基因调控网络(GRNs)决定并维持稳定的。因此分析单细胞的GRNs有助于深入挖掘细胞异质性背后的生物学意义,并为疾病的诊断、治疗以及发育分化的研究提供有价值的线索。然而单细胞转录组数据具有背景噪音高、基因检出率低和表达矩阵稀疏性的特点,给传统统计学和生物信息学方法推断高质量的GRNs带来了挑战。随着生物信息学的发展,研发了不少软件用于单细胞调控网络的分析,如软件SCENIC( Single-cell regulatory原创 2021-04-09 09:55:28 · 954 阅读 · 0 评论 -
转录因子调控网络分析
简介转录因子(Transcription Factors, TFs)是指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。转录水平的调控是基因调控的重要环节,其中转录因子(Transcription Factor,TF)和转录因子结合位点(Transcription Factor Binding Site,TFBS)是转录调控的重要组成部分。基因转录调控网络由于其可以直观地显示基因表达调控关系,已成为生物学研究的热点之一原创 2021-04-07 16:20:23 · 3623 阅读 · 1 评论 -
CircRNA–miRNA–mRNA调控网络分析
简介环状RNA(circRNA)是一种存在于真核细胞内,具有稳定环状结构的RNA分子。它主要通过充当miRNA的分子海绵对miRNA进行吸附,部分circRNA可竞争性结合miRNA,解除miRNA对靶基因的抑制作用,上调靶基因的表达,进而在转录水平上对靶基因的表达进行调控。miRNA与疾病的发生密切相关,因此,circRNA在疾病的发生过程中也发挥重要作用。此外,环状RNA可以通过结合不同种类的功能蛋白,分别在转录前、后及翻译水平严格调控细胞生殖生长等过程。环状RNA作为研究持续火热的明星分子,不同于对原创 2021-04-07 11:31:36 · 5801 阅读 · 0 评论 -
基因共表达网络分析图解
简介随着高通量生物实验技术的快速发展,特别是基因芯片和新一代测序技术的发展,全基因组范围内的基因表达数据呈爆炸式增长,利用网络生物学的方法对高通量基因表达数据进行分析和挖掘已经成为生物信息学重要的研究方向。通过基因共表达网络分析方法,可以将在功能上相关的基因识别为一个模块(module),通过对模块的进一步的分析,能够实现筛选module的核心基因,关联性状,代谢通路建模,建立基因互作网络等高级分析。Gene co-expression(基因共表达)是一种使用大量基因表达数据构建基因间的相关性,从而挖掘基原创 2021-04-02 16:29:35 · 23858 阅读 · 0 评论 -
蛋白质残基相互作用网络分析
简介蛋白质由20种不同的氨基酸经肽键聚合组成,通过形成特定的空间三级结构以实现催化和调控不同的生物学功能,不同的氨基酸排列顺序会形成不同的蛋白质结构,蛋白质三维空间结构决定了其生物学功能。因此,蛋白质三维结构研究对理解其如何发挥生物学功能和设计相关的药物具有重要意义。其中,蛋白质残基相互作用网络分析普遍应用于蛋白质相关问题的研究。该方法中网络的节点为组成蛋白质的残基,网络的边为非共价键残基相互作用,如范德瓦尔斯和静电相互作用等。基于蛋白质残基相互作用网络,可以进一步利用图论的方法研究蛋白质结构稳定性,蛋白原创 2021-03-31 16:05:08 · 1681 阅读 · 0 评论 -
蛋白质互作网络分析
简介蛋白质互作网络(protein protein interaction network,PPI network)是由蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。在生物医药领域有助于从系统的角度研究疾病分子机制、发现新药靶点等等。STRING数据库STRI原创 2021-03-31 09:17:23 · 5355 阅读 · 0 评论 -
多组学联合分析整体思路
多组学联合分析整体思路简介对于发病原因复杂的疾病通常很难用单一的理论模式进行表述。系统生物学研究方法为疾病发病机制的研究提供了新思路。系统生物学是通过整合生物系统中诸多相互联系和作用的组分来研究复杂生物过程的机制,即研究生物系统中所有组成成分(基因、RNA、蛋白质、表观遗传和代谢产物等)的构成以及在特定条件下这些组分间的相互作用和关系,并分析生物系统在某种或某些因素干预扰动下在一定时间内的动力学过程及其规律。高通量的组学(Omics)技术为系统生物学提供了海量的实验数据,而多组学联合分析技术除了提供数据原创 2021-03-29 16:28:02 · 10063 阅读 · 0 评论 -
一文看懂基因表达分析流程!
基因表达分析简介基因表达分析是指直接或者间接测量样本内的全部或者部分基因的表达情况,一般是对转录产物mRNA进行测量。并且可以同时对不同基因和/或不同样本的RNA表达水平进行比较。这种分析可以帮助科学家识别造成表型差异的分子基础,并选择目标基因进行深入研究。基因表达的常用检测方法有:实时荧光定量PCR(qRT-PCR)、基因芯片(Microarray)、表达序列标签(Expressed Sequence Tag,EST)、基因表达系列分析(Serial Analysis of Gene Expressi原创 2021-03-25 16:10:00 · 12163 阅读 · 0 评论 -
全基因组SNP分型(Whole Genome SNP Genotyping)分析简介
全基因组SNP分型(Whole Genome SNP Genotyping)简介全基因组SNP分型单核苷酸多态性(single nucleotide polymorphism,SNP)是遗传学研究中重要的材料。近年来,全基因组SNP标记开发方法的发展使得研究者们能够以较低成本获得丰富的基因组标记,大大推动了基因组水平的相关研究。基因组预测从已知基因型数据和表型数据的个体建立训练模型,对未知表型的个体进行基因型和表型预测,在育种领域具有重要意义。全基因组SNP的分型策略结合基因组预测方法,构成了动物基因组原创 2021-03-01 15:54:45 · 10814 阅读 · 2 评论 -
全转录组关联分析(TWAS)简介
全转录组关联分析(TWAS)简介简介全基因组关联研究(GWAS)已经确定了数千种与许多复杂特征相关的遗传变异。然而,它们的生物学机制在很大程度上仍然是未知的。最近提出的全转录组关联分析(transcriptome-wide association studies,TWAS)是研究与变异性状关联的潜在基因调控机制的宝贵工具。具体来说,TWAS整合了GWAS和基于一组共同变异的表达图谱研究,旨在确定其GReX与表型相关的基因。目前已经开发了各种方法或软件(如PrediXcan,S-prediXcan,Fus原创 2021-02-26 13:59:05 · 15425 阅读 · 0 评论 -
全基因组关联分析(GWAS)简介
全基因组关联分析(GWAS)简介全基因组关联分析(GWAS)是广泛用于寻找复杂遗传疾病关联基因的重要手段。通过遗传学研究找到了很多致病突变体,这些突变体是指染色体上的变异位点。全基因组关联分析试图找到染色体上的变异位点,并研究这些变异位点与疾病或其他性状的关联。目前,全世界范围内已开展了4000多项GWAS研究,发现了超过10万个与各种疾病(如癌症,高血压,II型糖尿病,类风湿性关节炎等)以及重要生理性状关联的基因位点。全基因组关联分析应用基因组中数以百万计的单核苷酸多态性(SNP)为分子遗传标记,利用回原创 2021-02-25 15:45:12 · 53584 阅读 · 0 评论 -
结构变异( SV )分析介绍
结构变异( SV )分析基因组结构性变异(Structure Variantions,简称SVs)通常指基因组上大长度的序列变化和位置关系变化。基因组结构性变异类型很多,包括长度在50bp以上的长片段序列插入或者删除(Big Indel)、串联重复(Tandem repeate)、染色体倒位(Inversion)、染色体内部或染色体之间的序列易位(Translocation)、拷贝数变异(CNV)以及形式更为复杂的嵌合性变异。结构变异检测常用的方法有:基于芯片的检测,包括芯片比较基因组杂交(array原创 2021-02-23 15:15:44 · 21538 阅读 · 0 评论 -
SNP Fine Mapping (精细映射分析)
SNP Fine Mapping (精细映射分析)SNP Fine Mapping简介fine mapping是GWAS之后的精细分析,通过GWAS分析鉴定出很多variation,但是不清楚哪些是casual variation。通过fine mapping,借助各种统计学模型(如贝叶斯等)来推测出哪些才是真正的casual variation。Fine-mapping变异分析的方法共有五种:(1)找与功能元件的overlap;(2)利用等位基因特异性变异的效应;(3)找破坏TFBS转录因子结合位点的原创 2021-02-22 11:23:25 · 6181 阅读 · 0 评论