四代测序时代之崛起

发表时间:2017-09-26 23:13

  纳米孔测序的构思诞生于1980年代。1989年,加利福尼亚大学生物分子工程系的David Deamer构思了一个想法:通过电泳对穿过膜上纳米孔的ssDNA进行测序或许可行。1995年,这一设想终于得以实现。其核心原理是将纳米孔作为一种生物感应器,给膜顺式 (cis) 边的离子液体接触反式(trans) 边的离子液体提供唯一的通道(图1a)。恒压偏置 (trans边为正值) 产生一个通过纳米孔的离子电流,驱使ssDNA/ssRNAcis腔穿孔入trans腔。一种酶(如聚合酶、解旋酶)与聚核苷酸牢牢地结合使得它的逐步移动控制着核苷酸,并将它们一个碱基一个碱基地“塞”过小纳米孔。由于穿过纳米孔最狭窄区域时的离子导电性对核酸碱基质量和其有关电场的存在特别敏感,通过纳米孔的离子电流水平就揭示了转位链上碱基的序列(图1b)。

  在近三十年的发展历程中经历了四个主要的技术革新(图2):一、单分子核苷酸从纳米孔通过;二、纳米孔上的酶和分子马达分别对于单核苷酸移位的控制;三、纳米孔上的酶和分子马达对在单分子核苷酸和碱基的测序精度上的控制;四、与MinION纳米孔检测设备的结合。



图1 纳米孔测序原理示意图。(a) 两个充满离子液体的腔室被一偏压膜分隔。一条单链聚核苷酸(黑色)被电泳驱使着穿过由MspA纳米孔(绿色)提供的唯一通道,离子或聚核苷酸酶就从这里由cis腔通往trans腔。聚核苷酸穿过纳米孔的移位由一种酶(红色)控制。(b) 部分显示通过纳米孔时由一灵敏的电流表测得的离子电流。纳米孔测链时,步速一般为每秒30个碱基,本次实验利用特别低浓度的ATP来降低解旋酶的活力,从而增加每个电流水平的持久度来显示可达到的分辨率。[1]


Oxford Nanopore Technologies (ONT) 公司早在2005年就已成立。以蛋白为基础的纳米测序系统的研发就是从这之后开始的。最初的纳米孔是α-溶血素蛋白形成的可容纳ssDNA的天然孔道。但是后来的研究发现该蛋白的感应区域太长。十几个碱基一起通过长感应区时,互相之间的信号会影响单个碱基的感应,所以后来替代α-溶血素MspA酶具有和它大小的孔径和更短的通道(图1)。

为了更好地检测ssDNA,天然MspA酶被改良为孔径稍大一点的工程MspA酶。华盛顿大学的HeLiz Manrao将改良后的MspA酶与phi29 DNAP结合以更精确地控制DNA分子在纳米孔的移位。 phi29 DNAP的作用是控制DNA进入MspA,但又不至于让DNA链太快通过纳米孔而来不及对碱基进行检测。2012ONT在基因组生物学技术进展年会 (AGBT) 上发布了这个基于phi29 DNAP-MspAMinION纳米孔系统



2   纳米孔 DNA 测序的里程碑[1].


MinION的性能包括:每个流动池可产生10-20 Gb的DNA测序数据;几百Kb的超长读长;实时测序读取数据;外观如USB盘的测序仪不到100 克;仅需要连接一般电脑而无需额外计算资源;可实现室外测序。2014年ONT公司启动先期MinION系统体验项目以来,陆续展现了MinION在不同领域发挥的优势

  表1 MinION 纳米测序仪的应用领域 [2]

应用

机体

样品

靶标

致病菌监管和细菌、病毒爆发研究

埃博拉病毒

RNA

WGS

埃博拉病毒

RNA

WGS

Salmonella typhi单倍型58

DNA

WGS

切昆贡亚热、HCV、埃博拉病毒

RNA

病毒基因组

克氏杆菌和耐甲氧苯青霉素S. aureus

DNA

WGS

Salmonella enterica

DNA

WGS

流感病毒 A

RNA

8个病毒基因和基因组

Klebsiella pneumoniaE. coliEnterobacter cloacae

DNA

种类和抗生素基因鉴别

单倍型重建

人类

DNA

HLA-A HLA-B

CYP2D6 基因

产前诊断

人类

DNA

非整倍性研究

癌症

人类胰脏细胞

DNA

结构性变异

淋巴细胞白血病患者

DNA

TP53扩增子测序

微生物群研究

20个不同细菌种类

DNA

16S rRNA基因

Escherichia coli

3个痘病毒

DNA

扩增子测序

鼠肠道微生物菌群

RNA

16S rRNA基因

转录组研究

Drosophila melanogaster

RNA

Rdl MRPMhc

Dscam1基因

Echis coloratus

RNA

毒液毒素编码基因

ERCC RNA Spike-In Mix

RNA

92个多聚腺苷酸化的转录子和HEK293细胞

微重力测序

细菌/病毒

DNA

WGS


  比如,研究疫情时直接将它带到疫情爆发区。在检测西非爆发的埃博拉病毒时,突出了与NGS测序相比下,MinION在测序读长、便携性,检测时长方面的优势。从样品准备到发现致病菌只需要6小时时间,而从样品放置机器到发现致病菌只需要4分[3]。凭借这些优势,使得MinION可以上天入地。在太空飞行中,发掘细菌和病毒是很困难的事情,大部分研究是将样品带回地球进行测序鉴定。然而目前,NASA宇航员已在国际空间站 (ISS) 内成功完成了微重力条件下的DNA测序 (图 3),这标志着人类已迎来“能对太空活体生物进行基因测序”的全新时代。另外,测序仪还会成为空间站其他科研的重要工具,比如直接检测绕轨飞行中遗传物质或基因表达的变异,而不用再像以前一样等几个月返回地球后才知道结果。


3 太空中的NASA宇航员工程师Kate RubinsMinION 系统 (照片源自: nasa .gov)


与二代测序 (IlluminaIon Torrent) 产生精确短读长的特点不同,三四代测序的读长虽长但精确度不高, 早期报道的MinION错误率约为35%[4],这是外界对MinION不断质疑的唯一原因。如今ONT的系统也已从蛋白质纳米孔迈入固态纳米孔(硅及其衍生物材料)测序的阶段,提升了自身在稳定性、电流噪声、工艺集成方面的表现。

随着时间的推移, ONT公司也在企图通过更新他们的碱基识别程序和化学试剂 (R6.0R7.0R7.3R9 R9.4) 来提高纳米孔测序的精确度。在一些需要区分较相似DNA序列分子的测序应用上,对精确度和读长的长度都有较高要求,比如对RNA、单倍型16S rRNA基因的测序。MinION的原始单链读长 (1D reads) 错误率在20%以上,但更精确的读长(平均错误率10%-15%) 可以通过读取互补链和计算电脑模拟的共有序列 (2D reads)的过程后生成。另外,2/3代测序技术都曾通过反复测同一模板来产生精确度更高的共有序列 (consensus) 。比如,“超长测序的条形码定向组装”技术(BAsE-Seq) 就是利用成熟的文库构建操作流程给每个片段指定了一个特定的条码,决定了短条码跟着一个末端配对的Illumina读长,用另一末端去重建一条共有模板读长。还有PacBio环形一致性测序模式(CCS) 通过合成反复通读环化模板,但这不能直接应用到纳米孔测序上,因为纳米孔测序中能穿过纳米孔的是单链线性模板。Circ-Seq产生的是线性模板 (平均3个重复单元),针对的是Illumina短读平台的短模板测序。

借鉴了PacBio公司的CCS模式,新加坡基因组研究院 (GIS) Nagarajan组开发了INC-Seq技术[5]。该技术利用了滚环扩增 (RCA) 技术对环状模板扩增,生成多个重复单元组成的环状分子,这些环状分子随后在测序前被打断成可被纳米孔平台测序的线性产物。这样对来自同一原始序列的DNA reads进行多次测序,然后通过计算合并这些信息,可以得到原始DNA对应的准确序列。该技术在包含了S. cristatusS. oralisP.micra的混合细菌样品16S rRNA基因测序应用中被验证。结果发现,利用INC-Seq进行16S RNA测序将reads的准确率提升至97%,而标准2D reads的准确率仅84%。错配率由7.5%降低了十倍至0.7%。此外,该方法还能计算出每个物种的正确丰度。但在测序更复杂的样品时,会受到扩增时DNA之间的黏连或者聚合酶的脱靶等的偏差影响。

Nagarajan团队正在研究改善INC-Seq技术的方法。通过在每个DNA分子的两端都连接上一个哑铃状接头,以确保该分子能够被重复读取,不仅能获得较长共有序列的精确度,还能减少运行周期。该方法的应用前景在未来可能体现在对复杂样本进行快速16S rRNA基因测序、RNA测序(研究复杂基因、同源异构体和大型基因家族)和组装分析。

  开发软件工具也是降低MinION测序的错误率的方法。针对MinION系统开发的软件种类包括序列统计、序列比对、SNV识别、图谱、从头组装等等 ( 2)。有时学者们也会使用其他平台的分析方法作为比较或是联用。例如,Nanocorr是专门针对Nanopore数据的校正管道;ALEC是更为广泛的ALEC (最初用于PacBio随机错误数据处理),特别适用于长扩增子。利用两者后错误率可从校正前的平均15%下降到校正后的4-5%[6]


表 2 现有可用于MinION测序数据分析的相对通用的和专用的软件工具 [7]

名称

应用

链接

Poretools

测序数据提取和统计

https://github.com/arq5x/ poretools

poRe

序列提取和基本统计

https://sourceforge.net/projects/rpore

BWA MEM

序列比对

https:// github.com/lh3/bwa

LAST

序列比对

https://last.cbrc.jp/

NanoOK

序列比对、统计和可视化

https:// documentation.tgac.ac.uk/display/NANOOK/

marginAlign

序列比对、统计和SNV识别

https:// github.com/benedictpaten/marginAlign

Nanopolish

信号比对、SNV识别

https:// github.com/jts/nanopolish

GraphMap

序列比对、SNV识别

https:// github.com/isovic/graphmap

minimap

快速近似图谱

https:// github.com/lh3/minimap

miniasm

从头组装

https:// github.com/lh3/miniasm

CANU

从头组装

https:// github.com/marbl/canu

Nanocorrect

从头组装

https:// github.com/jts/nanocorrect

PoreSeq

从头组装、SNV识别

https:// github.com/tszalay/poreseq

NaS

从头组装

https:// github.com/institut-de-genomique/NaS

Nanocorr

从头组装

https:// github.com/jgurtowski/nanocorr

Mash

种类鉴别、快速近似比对

https:// github.com/marbl/mash

minoTour

实时数据分析

https:// github.com/minoTour/minoTour

Read Until

选择测序

https:// github.com/mattloose/RUscripts

Nanocall

本地碱基识别

https:// github.com/mateidavid/nanocall

DeepNano

基于递归神经网络(RNN)的碱基识别

https:// bitbucket.org/vboza/deepnano



       ONT的纳米孔测序技术是目前唯一商业化的。处于第四代测序技术研发前沿的公司还有Northshore Bio (NSB)、Genia Technologies(GT)、Stratos Genomics (SG)公司、Noblegen Biosciences(NGB)等。这些公司研究领域覆盖了固态纳米孔、蛋白质纳米孔、标记测序法、非标记测序法等多个研究方向,但均采用了单分子测序法与电子信号检测技术。

  目前人类基因组测序的最低成本能达到单基因组$1000,但是相信在不久的将来,纳米孔测序技术会在经过不断的挑战与机遇中迎来它的全盛时代,使得人人支付得起基因测序。


参考文献:

[1] Kasianowicz JJ, Bezrukov SM (2016). Three decades of nanopore sequencing. Nature Biotechnology. 34(5) : 481-482.

[2] Magi A., et al. (2017). Nanopore sequencing data analysis: state of the art, applications and challenges.Briefings in Bioinformatics. 1-17.

[3] de Wit E., et al. (2016). The merits of malaria diagnostics during an Ebola virus disease outbreak. Emerging Infectious Diseases. 22(2):323-326.

[4] Laver T., et al. (2015). Assessing the performance of the Oxford Nanopore Technologies MinION. Biomolecular Detection and Quantification. 3: 1-8.

[5] Li C.H., et al. (2016). INCSeq: accurate single molecule reads using nanopore sequencing. GigaScience. 5:34.

[6] Minervini CF., et al. (2016). TP53 gene mutation analysis in chronic lymphocytic leukemia by nanopore MinION sequencing. Diagnostic Pathology. 11:96.

[7] Jian M., et al. (2016). The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome Biology. 17:239.


   

  微分基因专注于高通量测序技术,公司凭借国际领先的高通量测序平台,依托独具优势的高通量基因测序和大数据挖掘技术,为各大高校、医院、科研单位以及第三方健康管理服务平台,提供专业的基因检测和数据分析解读服务。2017年,微分基因在国家大基因中心建成2133平方米的洁净分子生物实验室,公司科研团队汇聚了一批国内外优秀的基因组学实验和生物信息分析研究人员。

      科技服务部依托公司先进的自动化建库仪、高通量测序仪等实验设备,提供多种测序服务;凭借强大的科研团队,为高校、科研院所等研究单位提供领先的生物信息分析服务。主营业务包括DNA测序、RNA测序、表观组学测序、单细胞测序、icell8单细胞表达谱测序、芯片服务、三代全长转录组测序等。



客户留言

客户留言

Customer Message

联系我们
Contact Us
联系邮箱:nanqing@magiltd.com 公司电话:0551-82311173 公司地址:
北京:北京市朝阳区惠河南街高碑店村一区33号楼
合肥:安徽省合肥市巢湖经济开发区未名生物医药园区C栋3楼
website qrcode

微分科服

website qrcode

微分健康