
遗传学
文章平均质量分 84
Gremmie2003
南京医科大学,生物信息学的学生,热爱编程和计算机,学习永远不会停下脚步
展开
-
[GWAS]基于plink的亲缘关系质控
这里我们使用的是ped和map格式,如果ped文件中有表型数据(第六列),如果想指定表型数据,就使用–pheno参数,包括三列:家系,个体,表型值。这里讲亲子关系的移除其实不是必须要的,比如我们分析的群体里面有亲子关系的个体,想要进行分析,不需要做这一步的筛选。这里的文件是bed二进制文件,不方便查看,我们将其转化为ped文件和map文件。本篇我们要对一下具有亲子关系的个体进行过滤,然后计算类似于IBS的结果。,两个个体拥有相同的等位基因(不一定来源以同一祖先)。接着我们提取Z1大于0.9的个体。原创 2023-07-17 01:57:21 · 2638 阅读 · 0 评论 -
[GWAS]杂合度质控
在一群自然群体种,基因型个体的杂合度过高或者过低都是不正常的,我们需要根据杂合度来进行过滤。plink有个特点,所有的过滤标准,都可以生成过滤之前的文件,然后可以手动过滤,也可以用参数进行过滤。我们采取的做法是删除样品杂合率平均值中偏离±3 SD(sd就是标准差)的个体。去掉这两个个体之后,先对数据进行清洗,去掉引号,然后提取家系合个体ID。非自然群体中,比如自交系,杂交种F1,这些群体不需要过滤杂合度。我们从结果可以看出,这两个个体杂合度在3倍标准差之外。首先我们来查看哪些个体在3倍的标准差之外。原创 2023-07-17 01:28:53 · 788 阅读 · 0 评论 -
[GWAS]基于plink的(hardy-weinberg)哈温质控
一个群体是否符合这种状况,即达到了遗传平衡,也 就 是 一 对 等 位 基 因 的 3 种 基 因 型 的 比 例 分 布 符 合 公 式 :p2+2pq+q2=1,p+q=1,(p+q)2=1.基因型MM的频率为p2,NN的频率为q2,MN的频率为2pq。而哈温平衡检验,则是根据基因型推断出理想的(AA,AT,TT)的分布,然后和实际观察的进行适合性检验,然后得到P值,根据P值进行筛选.即P值越小,说明该位点越不符合哈温平衡。对于一个位点"AA AT TT",其中A的频率是基因频率,AA为基因型频率.原创 2023-07-16 23:41:40 · 1249 阅读 · 0 评论 -
[GWAS]plink基因数据性别质控并用R作图
本篇主要针对人类性别的信息的质控,主要是根据性染色体上SNP的比值,判断性别,然后把性别错误的个体去掉或者更改性别信息.对其他的物种参考意义不大,因为在动物中一般会把性别信息的SNP去掉。然后将相关错误的ID提取出来(家系ID,个体ID),之所以提取家系ID和个体ID,因为plink有参数remove可以根据ID进行筛选.我们从图中可以看出,woman中,大部分都是小于0.2的,有一个为1,这个应该是错误的ID。plink自身也有–check-sex的参数,所以操作一下,留下笔记。接着我们检查性别冲突。原创 2023-07-16 13:49:50 · 2157 阅读 · 0 评论 -
[GWAS]plink数据格式的转化和缺失质控
plink中一些数据文件的解读以及转化,基因数据的缺失质控原创 2023-07-16 00:58:38 · 1573 阅读 · 0 评论 -
[遗传学]转座因子的结构与功能
本篇文章主要带你了解:转座因子的发现和分类;原核生物以及真核生物种的转座子;转座作用的分子机制以及转座因子的遗传学效应和应用.🧬。原创 2023-05-16 21:45:59 · 3245 阅读 · 2 评论 -
一篇你看得懂的SNP
指的是由单个核苷酸—A,T,C或G的改变而引起的DNA序列的改变,造成包括人类在内的物种之间染色体基因组的多样性。是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入,形成的遗传标记。通过全基因组或者外显子测序数据与参考基因组序列做比较,结合以后的SNP数据库信息,分析已有的SNPs,或者挖掘新的SNPs。由于基因序列的简并性,含有编码序列的单核苷酸多态性(SNP)不一定会改变蛋白的氨基酸序列。1、SNP具有已知性、可遗传性、可检测性,可用于疾病基因的定位、克隆和鉴定,寻找疾病相关的突变位点。原创 2023-04-29 23:03:53 · 3063 阅读 · 0 评论 -
[遗传学]近亲繁殖与杂种优势
人类的镰刀形血红蛋白杂合体(HbA/HbS)的红细胞中同时存在着两种血红蛋白:成人血红蛋白(HbA)和刀形细胞血红蛋白 (HbS)。(heterosis )是指两个遗传组成不同的亲本杂交产生的杂种一代(F1),在生长势、生活力、繁殖力、适应性以及产量和品质等性状上比双亲优越的现象。在图6-8通径图中由X←A→Y及由 X←B→Y 两条通径链连接X、Y两个特定个体,一条经过共同祖先A,另一条经过共同祖先B,而A、B两个个体。在AA × AA,aa × aa交配类型→产生的子代的基因型(或表型)全部都是。原创 2023-04-29 15:15:35 · 5092 阅读 · 0 评论 -
数量形状遗传率及计算方法
例如,有人调查先天性房间隔缺损在一般群体中的患病率为1/1000(0.1%),在100个先证者的家系中调查,先证者的一级亲属共有669人(双亲200人,同胞279人,子女190人),其中有22人发病,例如,对躁狂抑郁性精神病的调查表明,在15对单卵双生子中,共同患病的有10对;在群体中,某数量性状的遗传变异属于总的表型变异的一部分表型变异的其余部分是环境变异。总的表型方差可剖分为。(monozygotictwin,MZ)是由一个受精卵形成的两个双生子,他们的遗传基础理论上是完全相同的,其个体差异主要由。原创 2023-04-29 14:23:29 · 7982 阅读 · 1 评论 -
数量性状基因座QTL及其作图
在QTL的区间定位中,需要计算出某QTL在两个相邻的分子标记区间中各位置的LOD值,而LOD值是似然比L/L的常用对数来表示的,即。由于自交的遗传效应使纯合个体增多,杂合个体减少,最后获得家系内基因型纯合稳定一致、家系间基因型不同的RILS永久性群体是研究分子标记的理想材料。经典的数量遗传分析方法 ->只能分析控制数量性状表现的众多基因的综合遗传效应,无法准确鉴别基因的数目、单个基因在染色体上的位置和遗传效应。在检测作图群体的每个个体的标记基因型值的同时,测定其数量性状值。将每个个体的数量性状。原创 2023-04-29 12:53:59 · 9018 阅读 · 0 评论 -
病毒的遗传分析
1个噬菌斑大约含有107个噬菌体,它们起源于同一个噬菌体是噬菌体反复侵染、裂解细菌后产生的噬菌体后代,因此有相同基因型。通过观察菌斑的形态来鉴别噬菌体的基因型。噬菌体突变影响生活周期,会产生不同噬菌斑。噬菌斑是噬菌体感染宿主细菌后,在细菌涂布平板培养基中形成的,肉眼可见的透明圈.:不同突变之间无互补的功能区域,即该区域是一个独立的功能单位,是基因的同义词。原创 2023-04-27 19:24:36 · 991 阅读 · 0 评论