【佳学基因检测】将基因信息大众化的第二代高通量测序技术（NGS)

第二代测序技术也称高通量测序（high-throughput sequencing，HTS）技术，相对于一代测序，它可以实现大规模平行测序，基本原理是将基因组分割成短片段，对短片段测序再进行拼接。

对比第一代测序技术拥有着高通量、低成本等优势，目前相同数据量的检测，其成本约为一代测序技术的0.01%，极大地推动了测序技术在临床检测方面的应用。

2005年454公司基于焦磷酸测序法推出了Genome Sequencer 20 System(GS 20)系统，开启了高通量测序的进程。2007年，罗氏公司收购了454，并推出了一系列性能更优的NGS系统，极大的提升测序通量和准确性。

尽管具有读长优势，但是测序通量和成本始终限制了454平台的推广，同样数据量下成本约是illumina的100倍，因此罗氏在2016年底终止了454NGS测序相关的业务。

2006年Solexa公司推出了Genome Analyzer系统，包括DNA簇、桥式PCR和可逆阻断等技术，这使得GA系统在高通量、低成本、应用范围广等方面具有明显优点。2007年，Illumina公司收购了Solexa并发布二代测序仪。

二代测序经过这些年的发展已经步入成熟期，目前市场上根据测序技术可以可以把二代测序平台分为4类：边合成边测序法（Illumina）、半导体测序法（ThermoFisher）、联合探针锚定聚合测序法(华大智造)和焦磷酸测序法。

Illumina边合成边测序

Illumina测序的流程主要包括样品制备，簇生成，测序，数据分析。

首先是样本制备和建库。用DNA或RNA抽提试剂盒提取核酸，然后用超声波将其随即打断成90-250bp左右的长度或者控制全部DNA在一定长度范围内。

为了后续的扩增和测序，需要在这些DNA片段加入特定的序列。如下图，分别是与流动池引物互补结合的区域（P5、P7）、与Read 1和read 2测序引物结合的区域（Rd1SP，Rd2 SP）以及标签序列区域Index。

图片

添加完接头序列的DNA合集称为DNA文库，这样就完成了建库，该步骤可以采用商业化的文库制备试剂盒完成。

第二步是成簇Cluster Generation。

成簇是上述DNA片段被扩增的过程，该过程在流动池(Flow cell) 中完成。流动池是一种含有8个通道的厚玻璃片，每条通道中都随即植入了能与文库接头P5或P7互补结合的短DNA片段。

图片

首先引物和流动池的固定DNA片段互补配对，固定在通道表面，然后在DNA聚合酶作用下DNA链进行互补延伸形成DNA双链。通过变性，其中的单链被洗脱，剩下的一条单链会与旁边的固定接头链接，形成单链桥。

图片

同样的，单链桥在DNA聚合酶作用下延伸配对形成双链桥，通过变性形成2条单链，这两条单链又分别与旁边的固定引物结合，形成2个单链桥。重复这个循环，最终形成数百万的DNA簇。

图片

上述过程所有的DNA片段都会被扩增，扩增结束后，反向连会被切断洗脱，只留下正向链，为防止互补结合重新形成单链桥，3‘端被封锁。

图片

第三步，测序。

首先，在流动池中加入荧光标记的dNTP和酶，由引物起始开始合成子链。由于dNTP存在 3’端叠氮基会阻碍子链延伸，因此每个循环只能测得一个碱基。合成完一个碱基后，洗掉多余的dNTP和酶，使用激光扫描获得荧光信号。

随后加入试剂将叠氮基团与荧光基团切除，然后流动池再通入荧光标记的dNTP和酶，由引物起始开始合成一个碱基。不断重复这个过程，完成第一次读取。

图片

所有的DNA片段的一个碱基会被同时读取，在大规模并行的过程中，机器读取的图像类似下面这样：

图片

同时，加入了不同的index来区分每个样本及正负链。在完成第一次读取后，复制出的链会被洗去，index片段引物被引入并与模板杂交，完成序列读取后被洗去。这样读取到的序列与开始时已知的index比对后就可以给测得的序列贴上标签，方便后续分析。

Paired-end测序已经是现在的主流，要完成双末端测序，首先要将模板链3’去保护，模板折叠，index片段引入，在聚合酶参与下形成双链桥，然后变性，恢复为单链，然后将正向链切除并洗去，留下反向链，与正向链类似，经过多个循环后完成读取。

第四步，数据分析

测序完成后会产生数百万个reads，基于在样品准备时构建的index 分类来自不同样本的序列。对于每个样品来说，具有相似延伸的碱基被聚在一起。正向和反向read配对生成连续序列。这些序列通过与参考基因组匹配后，实现完整序列的构建。

Thermo Fisher半导体测序法

赛默飞的Ion Torrent平台是基于半导体技术的高通量测序仪。该平台使用了一种布满小孔的高密度半导体芯片，一个小孔就是一个测序反应池，孔底部带有感应器。

图片

其测序的核心技术是利用半导体技术进行信息读取，测序过程中每当有碱基结合，便会释放H+，而氢离子会引起电势的改变从而被检测到。通过对氢离子的检测并转化为电信号，最终实现实时碱基判读。

其测序的流程主要包括建库，油包水PCR，测序，数据分析。

首先是建库

与illumina 的 3’端带突出 T 碱基粘性末端的接头有所不同，建库过程中DNA两端加入的是平端接头（P1）和X或A接头，X接头带有index，A接头不带。

图片

X 接头带Barcode 序列（近末端蓝色序列），而A 接头不带Barcode 序列。

X 接头的好处是可以把一个芯片的测序通量分配给多个文库，测完序之后用Barcode 区分。

A 接头的好处是直接测到样本序列，这样对于充分利用测序的读长无疑是更好的。但是它的缺点是没有Barcode，所以一张芯片只能放一个样本。

AmpliSeq 是Ion Torrent 平台上的建库方案，它的核心是通过多重PCR 的方法，一次从样本中把要测序的多个DNA 片段给扩增出来，然后转化成文库进行测序。

图片

PCR 产物两端20-30bp 碱基都是 PCR引物的序列，如果将其进行测序，则会浪费掉相当一部分测序读长及数据量。因此在这个引物上特别设计了一种化学修饰，这种化学修饰可以被Fupa试剂所消化，而后的测序就可以尽可能多地测到样本序列。

乳液PCR或油包水PCR

Ion Torrent 测序前需要把文库结合到测序微珠上去，并且进行扩增，此种方法称为油包水PCR，也称Emulsion PCR（乳液PCR）。

EP 管中包含油相和水相，其中水相是核心，油相起到分隔作用。水相中包括文库、引物、酶、MasterMix、测序微珠等PCR反应的主要成份。

图片

测序微珠的直径约1~2.4微米，每个油包水PCR都含有许多微珠，这些微珠的表面共价连接了许多PCR引物，与P1序列互补。

同时油包水PCR中的游离PCR引物，其序列与A/X接头一致，且5‘端都标记了生物素。

把引物、酶、测序微珠等先在水相中混合，再加入油，混合形成乳浊液，油把水相分隔成一个个的小水滴。PCR反应后，微珠表面就会长出水滴内所含DNA 文库的扩增拷贝。

图片

然后加入带有链霉亲和素标记的磁珠与微珠进行混合。发生了PCR 的微珠由于其引物上带有生物素，便会与磁珠结合；没有发生PCR 的微珠由于没有生物素，不会与磁珠结合。接着，用磁铁吸附富集有效微珠，再清洗掉上清液中没有PCR 的微珠，最后用洗脱液把微珠与磁珠分离开来，进行测序。

测序

测序主要发生在一张半导体芯片上，上面做了数以百万、千万计的小孔，每个小孔的既是测序微珠的容器，又同时是一个微型的PH 计。

每个小孔正好可以容纳一个测序微珠，当DNA聚合酶把核苷酸聚合到延伸的DNA链上时，会释放出一个氢离子，反应池中的PH发生改变，位于池下的离子感受器就会感受到信号，把化学信号直接转化为数字信号，从而读出DNA序列。

图片

数据分析

把分别含Ａ、C、G、T 四种 dNTP 的溶液，分别依次地流过芯片的表面。

举例来说，流入的是dCTP 溶液，而模板上正好有一个G 碱基，就发生聚合反应，并产生电压变化，而且会被记录下来。如果流入的溶液与模板上的碱基不匹配，就不会发生聚合反应，也就没有电压变化，也就不会有碱基被记录下来。

如果正好有 2 个一样的碱基相邻，一次就会有2 个碱基被聚合到DNA 链上，电压变化值就会加倍，序列中2 个新的碱基被记录下来。

华大智造联合探针锚定聚合测序法

2013年3月18日，华大基因对CG(Complete Genomics)公司全额收购，开启了华大测序仪之路。历经多年的研发和改进，华大基因相继推出的BGISEQ-500、BGISEQ-50、MGISEQ-200、MGISEQ-2000M、MGISEQ-T7等测序体系。

其测序平台采用的是DNB（DNA Nanoball ，DNA纳米球）测序技术，每个DNA的直径约220-240nm。

主要步骤包括文库制备，cPAS测序，数据分析等。

样本准备和建库

MGI文库构建采用泡状接头及与之对应的扩增产物，有长接头及短接头，单端和双端index。

图片

将文库进行单链分离及环化处理后，以单链环状DNA为模板，在DNA聚合酶作用下使用滚环扩增将单链环状DNA扩增2-3个数量级，此时扩增产物被称为DNB。

图片

DNB经过DNB装载技术固定在阵列化的硅芯片上形成纳米芯片，由于一个DNB结合到芯片上的小孔后会排斥其他DNB结合，因此每个小孔仅容纳一个DNB，保证了信号点间不会相互干扰。

测序

采用半导体加工工艺，在经过修饰的硅片表面形成结合位点阵列（直径约200nm），实现DNA纳米球的规则排列吸附，阵列位点的间距约700nm，每个位点只固定一个DNB，保证不同纳米球之间的光信号不会互相干扰。

带有荧光探针的Read1引物在DNB上匹配互补，随后系统对光信号采集，得到待测序列。

MDA（multipledisplacement amplification）二链测序，随机引物在多个位点与模板DNA结合，在Phi29DNA聚合酶作用下起始复制，沿着DNA模板合成DNA，同时取代模板互补链；被置换的互补链又变成新的模板进行后续扩增。完成第一链测序后，在该酶作用下形成第二链，通过DNA分子锚，进行第二链cPAS测序。

图片

(责任编辑：admin)