版权归原作者所有,如有侵权,请联系我们

[科普中国]-第二代DNA测序技术

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

第二代DNA测序技术又称下一代测序技术,是对第一代测序技术的划时代变革的核心。现有的技术平台主要包括Roche/454 GS FLX、Illumina/Sol-exa GenomeAnalyzer、Helicos BioSciences公司的HeliScope™ Single Molecule Sequencer、美国Dana-her Motion公司推出的Polonator;以及连接法测序 (sequencing by ligation),即通过引物来定位核酸信息,技术平台有Applied Biosystems/SOLiD™ system。以上技术平台所运用的测序原理均为循环微阵列法1。

背景DNA测序技术长期以来,DNA测序技术一直是分子生物学相关研究中最常用的技术手段之一,从一定程度上推动了该领域的快速发展。人类基因组计划、转录组分析、微生物基因组重测序、单核苷酸的多态性 (single nucleotide polymorphisms,SNP) 分析等方面也促进的其他生物学领域的研究和发展。每一代测序技术的更替都标志着生物学中基因芯片、数据分析、表面化学、生物工程等技术领域有了新的突破,从而应用在了测序领域,大大降低了测序成本,提高了测序效率,使测序向着高通量、低成本、高安全性和商业化的方向发展1。

第一代DNA测序尽管第一代 DNA 测序技术以其可达 1000 bp 的测序读长、99.999% 的高准确性帮助人们完成了大量的测序工作,但其测试速度慢、成本高、通量低等方面的不足,也致使其不能得到大众化的应用。随着科学技术的进步以及科研人员对测序技术的努力开发,2005 年 Roche 公司发布的 454 测序系统标志着测序技术跨人高通量并行测序的时代。第二代 DNA 测序技术又称大量并行测序技术 (massive parallel sequencing,MPS)、高通量测序技术(high—throughput sequencing,HTS),以低成本、99% 以上的准确度,1次可对几百、几千个样本的几十万至几百万条 DNA 分子同时进行快速测序分析。这一时期的代表技术有 Roche 公司的 454、Illumina公司的 Solexa、ABI公司的SOLID,由于该时期的测序技术十分前沿,因而市场主要被这三家公司所垄断2。

基本平台454焦磷酸法平台454焦磷酸法平台是最早上市的循环微阵列法平台,使用的是边合成边测序 (sequencing by synthesis, SBS)技术,避免了Sanger法存在的宿主菌克隆问题3。

①首先将待测的目的DNA分子打断成 300-800 bp 的片段,然后在 DNA 片段的 5′ 端加上一个磷酸基团,3′ 变成平端,在两端分别加上 44 bp 的 A、B 两个衔接子,组成目的 DNA 的样品文库。加上这样两个衔接子 A、B 的目的是为了其在生物素和链霉亲和素的作用下,同含有过量链霉亲和素的磁珠特异性结合3。

②目的 DNA 片段固定到一个磁珠上之后,将磁珠包被在单个油水混合小滴(乳滴),在这个乳滴里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响,从而实现了所有目的 DNA 片段进行平行扩增乳滴 PCR (emul-sion PCR, emPCR),经过富集之后,每个磁珠上都有约 107 个克隆的 DNA 片段3。

③随后将这些DNA片段放入 PTP(Pico TiterPlate) 反应板中进行后继测序。PTP平板含有 160 多万个由光纤组成的孔,孔中载有化学发光反应所需的各种酶和底物3。

④测序开始时,放置在四个单独的试剂瓶里的四种碱基,依照 T、A、C、G 的顺序依次循环进入 PTP 板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸盐 (inorganic pyrophosphate, PPi) 分子。PPi 在ATP硫酸化酶的催化下与腺苷酰硫酸反应生成 ATP,ATP 与虫萤光素反应发光,光信号的最大波长约为 560 nm3。

⑤此反应释放出的光信号实时被仪器配置的高灵敏度 CCD 捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号,由此一一对应,就可以准确、快速地确定待测模板的碱基序列,读长可达到近 500 bp3。

Solexa基因组分析仪Solexa 分析仪通常也被称为 Illumina 测序仪,所使用的方法是克隆单分子阵列技术3。

①将目的DNA分子打断成 100-200 bp 的片段,随机连接到固相基质上,经过 Bst 聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的 DNA簇 (DNA cluster),每个DNA 簇中约有1000个相同序列的 DNA 片段3。

②之后的反应与Sanger法类似,加入用4种不同荧光标记并结合了可逆终止剂的 dNTP。固相基质上每个孔有八道独立检测的位点,所以一次可以并行八个独立文库,可容纳数百万的模版克隆,可把多个样品混合在一起检测,每个固相基质上一次可读取10亿个碱基3。

③DNA 簇与单链扩增产物的通用序列杂交,由于终止剂的作用,DNA 聚合酶每次循环只延伸一个 dNTP。每次延伸所产生的光信号被标准的微阵列光学检测系统分析测序,下一次循环中把终止剂和荧光标记基团裂解掉,然后继续延伸 dNTP,实现了边合成边测序技术3。

④其主要的缺点是由于光信号衰减和移相的原因使得序列读长较短,可以进行每个 DNA 测序片段的阅读长度仅为 75 bp 的末端双向测序反应3。

SOLiD高通量测序仪SOLiD(sequencing by oligonucleotideligationand detection, SOLiD)测序技术最初是由哈佛大学 Church 研究小组成员Shendure等所发明的。Church 研究组发明的方法的一部分授权给了 Agen-court 公司,并在 2006年7月被美国应用生物系统公司 (Applied Biosystems lnc, ABI) 收购,组建 SOLiD 测序平台。基于该原理的最新测序平台是于2010年末推出的5500xl,已是第五代产品3。

①首先制备 DNA 文库。SOLiD 技术支持两种测序文库,分别是片段文库(fragment library)和配对末端文库(mate-paired library)。将待测的DNA分子打断,并在两端加上接头,则可组成片段文库。而配对末端文库则是先把DNA分子打断,在中间加入 EcoP15 酶切位点和internal接头后进行环化,然后用 EcoP15 酶切,使得接头的两端各有27 bp的碱基,最后在两端加上接头,构成文库,适用于全基因组测序、SNP分析、结构重排及拷贝数的分析等相关领域4。

②第二个阶段与454焦磷酸测序法相同,加入磁珠等反应元件进行 emPCR 平行扩增,不同的是该方法的磁珠只有1 µm。在连接测序中,底物是 8 个碱基的八聚体单链荧光探针,在5′末端分别标记了CY5、Teaxs Red、CY3、6-FAM这四种颜色的荧光染料。3′ 端的第 1、2 位碱基类别排序分别对应着一个固定的荧光染料,第 3、4、5 位碱基“n”是随机碱基,第 6、7、8 位碱基“z”是可以和任何碱基配对的特殊碱基3。

③一次测序中包括了五轮连接反应。每轮连接反应首先是由3个碱基“n”介导,将八聚体连接在引物上,测序仪记录荧光染料信号,然后断裂掉碱基“z”,准备连接下一个八聚体。一次循环后,将引物重置,进行第二轮连接反应,反应位置比前一轮错开一位,这样引物上的每个碱基都会有两次与第1、2位的相连接,显著减小了测序误差 3。

HeliScope测序仪HeliScope 测序仪是由 Quake 团队设计开发的,从原理层面上来看,属于第二代测序原理,是循环芯片测序仪的一种。但是其在第二代的基础上引入了单分子测序的概念,被称为2.5代。

①该方法克服了第二代测序技术中需要用 PCR 扩增来增强荧光信号这一技术难题,采用了更加灵敏的图像传感器 (charge-coupled device, CCD) 可以出检测单分子 dNTP 携带的荧光基团发出的信号,单次扫描时间只有 15 ms 5。

②HeliScope利用精密的全内反射显微镜 (total internal reflection microscopy) 技术,在测序结束后去掉延伸的合成链,从相反的方向再进行另一次测序,生成同一模板的第二个序列信息,双向测序显著提高了原始数据准确度 3。

③HeliScope 测序仪和 454 测序仪一样,测序是不同步完成的,而测序速度由每条模版的序列来确定。由于大量的未标记碱基、不发光碱基和污染碱基的渗入,检测确实突变的出错率较高,但检测碱基替换突变的误差率较低3。

本词条内容贡献者为:

江松敏 - 副教授 - 复旦大学