保捱科技网
您的当前位置:首页RNA-seq

RNA-seq

来源:保捱科技网
RNA-Seq的核心是二代DNA测序技术,它应该是迄今为止应用最为广泛的高通量转录组测序方法。

mRNA—Seq的文库制备与测序方法过程如下:首先分离出样本细胞组织中的RNA,用Poly(T)寡聚核苷酸提取Poly(A)+RNA。然后对Poly(A)+RNA进行片段化处理,接着利用随机引物和反转录酶合成cDNA,再合成双链cDNA,之后对cDNA进行末端修复并添加测序链头。为了提高测序效率,通常采用电泳切胶法提取一定长度范围的cDNA,再对其进行PCR扩增,最终得到cDNA文库。若文库制备遵循链特异性协议,可为后续数据处理阶段的转录组重建及表达水平估计提供转录本的方向信息。在测序阶段,将制备完成的cDNA文库放入测序平台的通道内.测序仪器先对cDNA进行PCR扩增,之后开始测序.测序主要通过检测荧光信号来确定测得的碱基及顺序,其过程又称作“洗和检测”.按照是否从cDNA两端测序,RNA-Seq可分为单端和双端两张方式,维修红双端测序能提供更准确的转录本信息,这有助于基因表达水平的估计。测序产生的核苷酸序列被称为“读段”,其长度范围为35-500碱基。一般来说,测序深度越高,产生的读段数据量也越大。二代测序已能一次产生超过500千兆碱基的读段序列.

相对与传统的转录组信息挖掘方法,RNA-Seq具有如下优点:1.测序对象不局限于已知基因组。例如,RNA-Seq已被用于非模式生物的转录组测序;2。RNA-Seq可准确检测到转录边界和剪接位点;3.由于大部分RNA-Seq读段能够唯一映射至基因组,因此相对于微阵列,RNA—Seq的背景噪声更低;4。RNA—Seq读段数量的动态范围广,更有利于表达水平量化分析;5.可重复性高,生物学重复的相关系数达到0。93-0。95,技术重复的相关系数达到0。99。

RNA—Seq序列(又称为“读段\")的特点是长度短(25-200bp)、可靠性高,几乎每一条读段都能反映其所对应的RNA序列信息。同时,高通量序列是的读段覆盖范围广,

因而能够捕获RNA的全长序列信息。另外,通过对映射于基因组的读段进行计数并加以标准化处理和估计,便可获得基因的相对表达量。此外,RNA—Seq数据还可用于挖掘潜在的未知信息,如发现新基因转录本等。由此可见,RNA—Seq数据中包含了RNA序列、基因表达、新基因等在内的大量转录组信息。然而,如何从数据中获取这些准确可靠的转录组信息已经成为当前生物信息学的重要挑战.当前,基于RNA—Seq数据的信息挖掘方法主要有两个发展方向:一是以基因表达分析为研究目标,包括基因表达量估计、差异表达等;二是从RNA—Seq数据中重建转录组,以发现新基因和完善基因注释等。此外,基于RNA-Seq数据,还可设计生物信息血方法对可变剪接、可变启动子、可变蛋白编码等神武机制进行研究和分析.

RNA—Seq流程图

1.分理处样品中的mRNA

2.去除污染物DNA

3.RNA片段化处理

4.RNA反转录形成cDNA

5.结扎序列插座

6.选取一定长度范围内的cDNA序列

7.对cDNA进行高通量测序

转录组重建的关键步骤

读段映射

读段映射也被称为读段比对,指将测序读段映射至参考基因组或转录组序列的过程。由RNA-Seq原理可知,读段与转录组序列的片段相对应,同样也与基因组序列的片段相对应。由于当前大部分高等生物的转录组注释尚未完全,因此一般将读段映射至参考基因组序列。

剪接读段识别的比对方法

剪接读段识别的比对方法主要分为两类.第一类采用外显子优先策略,如Tophat,其内部调用Bowtie比对方法,采用外显子优先策略来映射读段。在exon—first法中,外显子读段优先被映射到基因组上,而后再将剪接读段映射至剪接位置。exon-first法占用的计算资源少,速度快,Tophat可通过—G选项提供现有注释基因的GTF文件,则读段映射便可按照基因注释有序进行,即读段优先映射到注释基因的位置,其余不能成功映射的读段再与基因组其他位置进行比对。映射完成后,即可得到以BAM/SAM格式文件发布的映射读段。这些BAM/SAM记录了读段在基因组上的位置信息以及每个碱基的映射质量。

Exon-first法,首先将完整的、外显子读段映射至基因组,而其余的读段被分割成更小的片段,再映射到基因组。之后,对小片段进行扩展以找到剪接位点。

因篇幅问题不能全部显示,请点此查看更多更全内容