【佳学基因检测】将基因信息大众化的第二代高通量测序技术(NGS)
第二代测序技术也称高通量测序(high-throughput sequencing,HTS)技术,相对于一代测序,它可以实现大规模平行测序,基本原理是将基因组分割成短片段,对短片段测序再进行拼接。
对比第一代测序技术拥有着高通量、低成本等优势,目前相同数据量的检测,其成本约为一代测序技术的0.01%,极大地推动了测序技术在临床检测方面的应用。
2005年454公司基于焦磷酸测序法推出了Genome Sequencer 20 System(GS 20)系统,开启了高通量测序的进程。2007年,罗氏公司收购了454,并推出了一系列性能更优的NGS系统,极大的提升测序通量和准确性。
尽管具有读长优势,但是测序通量和成本始终限制了454平台的推广,同样数据量下成本约是illumina的100倍,因此罗氏在2016年底终止了454NGS测序 相关的业务。
2006年Solexa公司推出了Genome Analyzer系统,包括DNA簇、桥式PCR和可逆阻断等技术,这使得GA系统在高通量、低成本、应用范围广等方面具有明显优点。2007年,Illumina公司收购了Solexa并发布二代测序仪。
二代测序经过这些年的发展已经步入成熟期,目前市场上根据测序技术可以可以把二代测序平台分为4类:边合成边测序法(Illumina)、半导体测序法(ThermoFisher)、联合探针锚定聚合测序法(华大智造)和焦磷酸测序法。
Illumina边合成边测序
Illumina测序的流程主要包括样品制备,簇生成,测序,数据分析。
首先是样本制备和建库。用DNA或RNA抽提试剂盒提取核酸,然后用超声波将其随即打断成90-250bp左右的长度或者控制全部DNA在一定长度范围内。
为了后续的扩增和测序,需要在这些DNA片段加入特定的序列。如下图,分别是与流动池引物互补结合的区域(P5、P7)、与Read 1和read 2测序引物结合的区域(Rd1SP,Rd2 SP)以及标签序列区域Index。
图片
添加完接头序列的DNA合集称为DNA文库,这样就完成了建库,该步骤可以采用商业化的文库制备试剂盒完成。
第二步是成簇Cluster Generation。
成簇是上述DNA片段被扩增的过程,该过程在流动池(Flow cell) 中完成。流动池是一种含有8个通道的厚玻璃片,每条通道中都随即植入了能与文库接头P5或P7互补结合的短DNA片段。
图片
首先引物和流动池的固定DNA片段互补配对,固定在通道表面,然后在DNA聚合酶作用下DNA链进行互补延伸形成DNA双链。通过变性,其中的单链被洗脱,剩下的一条单链会与旁边的固定接头链接,形成单链桥。
图片
同样的,单链桥在DNA聚合酶作用下延伸配对形成双链桥,通过变性形成2条单链,这两条单链又分别与旁边的固定引物结合,形成2个单链桥。重复这个循环,最终形成数百万的DNA簇。
图片
上述过程所有的DNA片段都会被扩增,扩增结束后,反向连会被切断洗脱,只留下正向链,为防止互补结合重新形成单链桥,3‘端被封锁。
图片
第三步,测序。
首先,在流动池中加入荧光标记的dNTP和酶,由引物起始开始合成子链。由于dNTP存在 3’端叠氮基会阻碍子链延伸,因此每个循环只能测得一个碱基。合成完一个碱基后,洗掉多余的dNTP和酶,使用激光扫描获得荧光信号。
随后加入试剂将叠氮基团与荧光基团切除,然后流动池再通入荧光标记的dNTP和酶,由引物起始开始合成一个碱基。不断重复这个过程,完成第一次读取。
图片
所有的DNA片段的一个碱基会被同时读取,在大规模并行的过程中,机器读取的图像类似下面这样:
图片
同时,加入了不同的index来区分每个样本及正负链。在完成第一次读取后,复制出的链会被洗去,index片段引物被引入并与模板杂交,完成序列读取后被洗去。这样读取到的序列与开始时已知的index比对后就可以给测得的序列贴上标签,方便后续分析。
Paired-end测序已经是现在的主流,要完成双末端测序,首先要将模板链3’去保护,模板折叠,index片段引入,在聚合酶参与下形成双链桥,然后变性,恢复为单链,然后将正向链切除并洗去,留下反向链,与正向链类似,经过多个循环后完成读取。
第四步,数据分析
测序完成后会产生数百万个reads,基于在样品准备时构建的index 分类来自不同样本的序列。对于每个样品来说,具有相似延伸的碱基被聚在一起。正向和反向read配对生成连续序列。这些序列通过与参考基因组匹配后,实现完整序列的构建。
Thermo Fisher半导体测序法
赛默飞的Ion Torrent平台是基于半导体技术的高通量测序仪。该平台使用了一种布满小孔的高密度半导体芯片,一个小孔就是一个测序反应池,孔底部带有感应器。
图片
其测序的核心技术是利用半导体技术进行信息读取,测序过程中每当有碱基结合,便会释放H+,而氢离子会引起电势的改变从而被检测到。通过对氢离子的检测并转化为电信号,最终实现实时碱基判读。
其测序的流程主要包括建库,油包水PCR,测序,数据分析。
首先是建库
与illumina 的 3’端带突出 T 碱基粘性末端的接头有所不同,建库过程中DNA两端加入的是平端接头(P1)和X或A接头,X接头带有index,A接头不带。
图片
X 接头带Barcode 序列(近末端蓝色序列),而A 接头不带Barcode 序列。
X 接头的好处是可以把一个芯片的测序通量分配给多个文库,测完序之后用Barcode 区分。
A 接头的好处是直接测到样本序列,这样对于充分利用测序的读长无疑是更好的。但是它的缺点是没有Barcode,所以一张芯片只能放一个样本。
AmpliSeq 是Ion Torrent 平台上的建库方案,它的核心是通过多重PCR 的方法,一次从样本中把要测序的多个DNA 片段给扩增出来,然后转化成文库进行测序。
图片
PCR 产物两端20-30bp 碱基都是 PCR引物的序列,如果将其进行测序,则会浪费掉相当一部分测序读长及数据量。因此在这个引物上特别设计了一种化学修饰,这种化学修饰可以被Fupa试剂所消化,而后的测序就可以尽可能多地测到样本序列。
乳液PCR或油包水PCR
Ion Torrent 测序前需要把文库结合到测序微珠上去,并且进行扩增,此种方法称为油包水PCR,也称Emulsion PCR(乳液PCR)。
EP 管中包含油相和水相,其中水相是核心,油相起到分隔作用。水相中包括文库、引物、酶、MasterMix、测序微珠等PCR反应的主要成份。
图片
测序微珠的直径约1~2.4微米,每个油包水PCR都含有许多微珠,这些微珠的表面共价连接了许多PCR引物,与P1序列互补。
同时油包水PCR中的游离PCR引物,其序列与A/X接头一致,且5‘端都标记了生物素。
把引物、酶、测序微珠等先在水相中混合,再加入油,混合形成乳浊液,油把水相分隔成一个个的小水滴。PCR反应后,微珠表面就会长出水滴内所含DNA 文库的扩增拷贝。
图片
然后加入带有链霉亲和素标记的磁珠与微珠进行混合。发生了PCR 的微珠由于其引物上带有生物素,便会与磁珠结合;没有发生PCR 的微珠由于没有生物素,不会与磁珠结合。接着,用磁铁吸附富集有效微珠,再清洗掉上清液中没有PCR 的微珠,最后用洗脱液把微珠与磁珠分离开来,进行测序。
测序
测序主要发生在一张半导体芯片上,上面做了数以百万、千万计的小孔,每个小孔的既是测序微珠的容器,又同时是一个微型的PH 计。
每个小孔正好可以容纳一个测序微珠,当DNA聚合酶把核苷酸聚合到延伸的DNA链上时,会释放出一个氢离子,反应池中的PH发生改变,位于池下的离子感受器就会感受到信号,把化学信号直接转化为数字信号,从而读出DNA序列。
图片
数据分析
把分别含A、C、G、T 四种 dNTP 的溶液,分别依次地流过芯片的表面。
举例来说,流入的是dCTP 溶液,而模板上正好有一个G 碱基,就发生聚合反应,并产生电压变化,而且会被记录下来。如果流入的溶液与模板上的碱基不匹配,就不会发生聚合反应,也就没有电压变化,也就不会有碱基被记录下来。
如果正好有 2 个一样的碱基相邻,一次就会有2 个碱基被聚合到DNA 链上,电压变化值就会加倍,序列中2 个新的碱基被记录下来。
华大智造联合探针锚定聚合测序法
2013年3月18日,华大基因对CG(Complete Genomics)公司全额收购,开启了华大测序仪之路。历经多年的研发和改进,华大基因相继推出的BGISEQ-500、BGISEQ-50、MGISEQ-200、MGISEQ-2000M、MGISEQ-T7等测序体系。
其测序平台采用的是DNB(DNA Nanoball ,DNA纳米球)测序技术,每个DNA的直径约220-240nm。
主要步骤包括文库制备,cPAS测序,数据分析等。
样本准备和建库
MGI文库构建采用泡状接头及与之对应的扩增产物,有长接头及短接头,单端和双端index。
图片
将文库进行单链分离及环化处理后,以单链环状DNA为模板,在DNA聚合酶作用下使用滚环扩增将单链环状DNA扩增2-3个数量级,此时扩增产物被称为DNB。
图片
DNB经过DNB装载技术固定在阵列化的硅芯片上形成纳米芯片,由于一个DNB结合到芯片上的小孔后会排斥其他DNB结合,因此每个小孔仅容纳一个DNB,保证了信号点间不会相互干扰。
测序
采用半导体加工工艺,在经过修饰的硅片表面形成结合位点阵列(直径约200nm),实现DNA纳米球的规则排列吸附,阵列位点的间距约700nm,每个位点只固定一个DNB,保证不同纳米球之间的光信号不会互相干扰。
带有荧光探针的Read1引物在DNB上匹配互补,随后系统对光信号采集,得到待测序列。
MDA(multipledisplacement amplification)二链测序,随机引物在多个位点与模板DNA结合,在Phi29DNA聚合酶作用下起始复制,沿着DNA模板合成DNA,同时取代模板互补链;被置换的互补链又变成新的模板进行后续扩增。完成第一链测序后,在该酶作用下形成第二链,通过DNA分子锚,进行第二链cPAS测序。
图片
(责任编辑:佳学基因)