ATAC-seq 染色质可及性
反映了基因的转录潜能和调控状态,与基因表达和功能密切相关。ATAC-seq的原理是利用转座酶Tn5,将带有测序接头的DNA片段插入到开放的染色质区域,然后对这些DNA片段进行扩增和测序,得到染色质可及性的分布图谱 高通量测序技术主要还是基于二代测序来进行检测的。基于这个原理,我们对于高通量的检测主要还是DNA/RNA的检测。对于蛋白检测的话,目前是通过质谱来做。 90s快速了解ATAC-seq_哔哩哔哩_bilibili 看这个视频即可 Tn5转座酶可以得到染色质可及性的图谱,是因为它对染色质的开放程度有选择性。染色质的开放程度是由核小体和其他蛋白质对DNA的包裹和修饰所决定的。因此,Tn5转座酶可以在开放的染色质区域产生更多的测序接头,而在紧密的染色质区域产生更少的测序接头。通过对这些带有测序接头的DNA片段进行扩增和测序,我们就可以得到染色质可及性的分布图谱,反映了不同区域的染色质开放程度。 ATAC-seq可以分析表观遗传 因为它可以快速、高效、低成本地检测染色质的开放状态,从而揭示基因组上的潜在调控元件,如启动子、增强子、沉默子等,以及转录因子结合位点等。这些信息可以帮助我们理解基因的表达和功能是如何受到表观遗传的影响的。 转录组read type是什么 常见的read type包括单端50 bp、单端75 bp和单端100 bp等。在双端测序中,每个RNA分子通常在两个方向上测序,因此read type通常包括两个长度,分别表示两个方向上的测序长度。例如,一些常见的双端read type包括双端50 bp、双端75 bp和双端100 bp等。 除了单端和双端测序,还有一些其他的read type,如paired-end、mate-pair、stranded等。其中,paired-end测序和双端测序类似,不同之处在于paired-end测序通常会将RNA分子的两个端点分别测序,从而可以更准确地确定RNA分子的起始和终止位置。mate-pair测序则是一种特殊的paired-end测序,通常用于测序RNA分子的非常长的区域,例如基因组上的大片段。stranded测序则是一种特殊的测序技术,可以确定RNA分子的方向性,即RNA分子是从5'端到3'端的方向上合成的还是从3'端到5'端的方向上合成的
单细胞转录组测序
是高通量测序技术的一种应用,是在单个细胞水平上对基因表达进行测量的技术。单细胞转录组测序利用高通量测序技术对单个细胞进行RNA测序,并对每个细胞的转录组进行分析,以揭示细胞间的差异、种类和功能。
什么是单细胞转录组?单细胞RNA测序(scRNA-seq) 10X单细胞转录组是一种常用的单细胞转录组测序技术,由10X Genomics公司开发。它利用了[微流控芯片](微流控芯片 - 搜索结果 - 知乎)和分子条码的技术原理,能够高效地分析数千个单个细胞的转录组。10X单细胞转录组技术通过分子条码的设计,可以将来自同一细胞的RNA分子进行标记并区分开来,从而减少了批次效应和噪音。这使得10X技术在揭示细胞异质性和发现罕见细胞类型方面具有优势。
10X单细胞转录组广泛应用于生命科学研究中,包括细胞类型鉴定、细胞发育轨迹推断、免疫细胞分析、癌症研究等领域。它为研究单个细胞的基因调控、发育和疾病提供了强大的工具和方法。 是一种利用高通量测序技术对单个细胞内的RNA进行定量和定性分析的方法。 单细胞捕获:将混合的细胞样本分离成单个细胞。如有限稀释法、流式分选法、激光切割法、显微操作法或微流控芯片法。
-
RNA提取和逆转录:将单个细胞内的RNA提取出来,并通过逆转录酶将其转化为cDNA。
-
文库构建和测序:将cDNA进行扩增、修复、接头连接等步骤,构建适合高通量测序平台的文库,并进行测序,可以使用不同的平台,如Illumina、PacBio或Oxford Nanopore。
-
数据分析:对测序得到的数据进行质量控制、比对、定量、标准化、降维、聚类、差异分析等步骤,得到单细胞的基因表达矩阵和相关的生物学信息,可以使用不同的软件和算法,如Cell Ranger、Seurat、Monocle等。
-
FASTQ 文件:FASTQ 文件包含了测序仪器生成的原始测序数据。每个序列通常包括序列读取(碱基序列)以及相应的质量分数。这些文件常用于存储从测序仪器读取的原始碱基信息。
-
SAM 文件:SAM(Sequence Alignment/Map)文件包含了从FASTQ文件中获得==的DNA或RNA片段的比对结果==。它包括序列的比对位置、质量信息和其他对分析有用的元数据。SAM文件常用于比对测序数据到参考基因组上。
-
BAM 文件:BAM文件是SAM文件的二进制版本,通常用于存储和传输比对数据。BAM文件通常更紧凑,占用更少的存储空间,并且更快速地进行访问和处理。
-
NCBI编号说明 1)AC_:genomic mixed,一些可供选择的注释的基因组序列,主要用来标记病毒和原核生物; 2)AP_:protein mixed,AC_标记序列对应的蛋白产物; 3)NC_:genomic mixed,完整的基因组分子序列,标记的类别包括基因组、染色体、细胞器、质粒; 4)NG_:genomic mixed,不完整的基因组区域,提供NCBI基因组注释途径。比较有代表性有不转录的假基因或者哪些很难自行化注释的基因组簇; 5)NM_:mRNA mixed,转录组产物序列;成熟mRNA转录本序列; 6)NP_:protein mixed,蛋白产物;主要是全长转录氨基酸序列,但也有一些只有部分蛋白质的部分氨基酸序列; 7)NR_:RNA mixed,非编码的转录子序列,包括结构RNAs,假基因转子等; 8)NT_:genomic automated,BAC或者鸟枪测序法的还未完全注释的测序序列; 9)NW_:genomic automated,BAC或者鸟枪法测序的还未完全注释的测序序列; 10)NZ_ABCD1234:genomic automated,收集的各种利用鸟枪法测序的测序计划,ABCD代表的是计划名称; 11)XM_:mRNA automated,转录产物;mRNA来自基因组注释,序列相当于基因组重叠群; 12)XP_:protein automated,蛋白产物;序列相当于基因组重叠群; 13)XR:RNA automated,转录产物;非编码区来自基因组注释,序列相当于基因组重叠群; 14)YP_:protein mixed,蛋白产物;不涉及到转录组,主要用来标记细菌、病毒和线粒体; 15)ZP_:protein automated,蛋白产物;主要是用电脑自动注释; 16)NS_:genomic automated,未知生物分子基因组序列。 不同的编码代号代表不同的意思,如NM开头的表示标准序列,XM表示预测的蛋白编码 序列,NR表示非编码蛋白的mRNA序列,AF开头的表示克隆序列,BC开头的表示模板序 列
-
The current format of a GenBank accession number is: [two-letter alphabetical prefix][six digits][.][version number]
GenBank入藏号的当前格式为:[两个字母的字母前缀][六位数字][][版本号] -
The format for older GenBank records is: [one-letter alphabetical prefix][five digits][.][version number]
较旧的GenBank记录的格式为:[一个字母的字母前缀][五位数字][][版本号]
什么是RIP-seq RNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,了解转录后调控网络动态过程,发现miRNA的调节靶点。运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。 RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)。RIP技术下游结合microarray技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。