1. DNBSEQ-T7
如果要选生命科学领域的国之重器的话,非测序仪莫属。前面我们讲过,基因是万物本源,而读取基因则是要用到测序仪。
现今,二代测序仪还是行业主流,illumina则牢牢占据着二代测序市场的垄断地位,华大则是有力的竞争者。其他的一个能打的都没有。
介绍完大背景,说回T7。T7的全称是DNBSEQ-T7。它是华大智造在去年国际基因组大会(ICG)上推出的一款超高通量的二代测序仪。
华大现在测序仪的命名也很直观,DNB+该款测序仪的通量。也就是说,T7的日测序通量能达到恐怖的7T,一天即可完成70个人的全基因组测序,也是现在单日产量最高的测序平台。
而微基因也是DNBSEQ-T7的第一批商业用户。想当年(2016年) llumina的x10测序平台包lane报价是7000元,均价70元每G,而仅仅三年的时间,微基因借助T7就出来了2499的全基因组测序,预计测序均价直接到了20元每G。
先来给T7打个免费的广告,一睹下T7的真容。
图片来自华大智造官网
很多人也很好奇,现在我们国产的测序仪到底能有illumina的几分功力?
UK BioBank之前评估过华大测序仪产生的数据,不过那时是华大自己出的。正好微基因作为第三方,我们可以通过数据分析看看T7在商业生产中数据的实际表现。
另外,这两天正好是第14届ICG大会,华大智造本次发布会真的是惊喜连连。后面我也专门介绍下本次发布会的新产品。
本篇我们接着上次的送样讲,我们的唾液/血液样本被送到测序公司后,他们都悄咪咪做了什么事情就拿到了基因组数据呢。
我们就借着BGISEQ500的测序视频,来给大家图解一下样本DNA提取,建库和DNB测序的三大步骤。
由于微信必须要求将视频放入腾讯视频才能发到公众号上,为避免版权问题,还是得麻烦大家将链接复制到网页或微信对话上发送给某人观看。视频来自华大智造的视频中心[1],总共2分45秒,消耗60M流量。制作精美,讲解详细,有网一定要看看。
https://1258877295.vod2.myqcloud.com/fe52eac0vodtranscq1258877295/74cd98e05285890787065846865/v.f20.mp4
下面除了最后一张图外,其他图片都来源于该视频。
2. 提取DNA
上次我们说到,DNA是在细胞的细胞核里,因此我们想读取DNA的话,必须先把DNA从核里弄出来。同时样本中还有大量的细胞碎屑、酶(蛋白质)和各种杂质。我们必须想办法把这些杂质都给去掉。
现在已经有很多成熟的商业试剂盒可以从各种人体样本中提取高质量的DNA。这块我们暂且不表。
不知道大家注意到没有,华大的提取DNA的这一步并非人工提取。而是直接通过机器自动提取的。也就是这台机器。
现在整个华大的测序中心都是大规模自动化的,只需要3-5个人,就可以管上几十台样本制备工作站和测序仪。更多自动化的仪器设备可以上华大智造的官网上转转。今年在ICG上更是推出了集成度更高的模块化数字生物实验室。
也就是说,做生物研究的各位能少做实验就少做实验吧。特别是一些重复性劳动的实验。
3. 建库
建库是DNA上机测序前的准备工作,不同公司的测序仪建库方法都不同。
我们之前说到人的一个细胞的DNA全部拉直了可以到3m长。这么长的DNA肯定是不能直接测序的。况且二代测序的测序长度(读长)也就是400-500bp,我们首先要将长的DNA打碎成一个个小片段。
现在常用的有超声波打断和转座酶打断两种打断方法。
超声波打断一般要求DNA的总量要1ug以上,好处是打断后收集到的DNA总量够,不用通过PCR扩增DNA,避免PCR过程中带来的偏差。
转座酶打断则仅需要1-10ng DNA即可微量建库,大大降低了DNA的用量。不可避免的是DNA量太少了,后续只能通过PCR扩增DNA。
接下来,超声波打断的DNA需要进行末端修复,然后加上接头,升温变成单链后环化。
而这些步骤都是为接下来的DNA纳米球(DNB)做准备。然后就是见证奇迹的时刻了。
通过滚环扩增,我们可以始终用同一个模板扩增出一个DNA纳米球(DNB)出来。而这也是华大测序的核心技术,华大测序仪DNB的名称来源。
相较于illumina的桥式扩增,DNB建库单次扩增的错误不会累积,最大程度上还原基因组原始序列的信息,在indel检测上有显著优势。
拿到DNB文库后,我们的建库步骤就做完了。
需要再次说明的是,华大和illumina的建库是两条完全不同的路子,因此建库试剂盒并不通用。
此外,现有的成熟建库方法也就这几条路子。研发新的测序仪要么就开发新路子,要么就得买专利,基本上封锁了整个测序仪领域。后面我们也专门用一期讲讲其他国产测序仪的情况。
4. 上机测序
放到测序仪里的实际上是下图的小芯片。芯片上放大来看就有很多很多小的坑位(探针)。当DNB流过芯片时,就会和探针结合在一起,一个萝卜一个坑的乖乖站好。这个技术也是华大引以为傲的联合探针锚定聚合技术(cPAS)。
然后将ATCG四种带有不同荧光标记的碱基流过整个芯片,碱基就会在聚合酶的作用下一个个加在待测序列上。
当然,每一轮测序只会精准的加上一个碱基。
激发荧光标记后再使用显微镜扫描所有的DNB,就可以读取DNB上待测序列的信息了。
通过DNA提取、建库、测序等重重努力,我们终于可以获得我们全基因组的测序数据了。
One More Thing
很多人一直不清楚DNB是如何做双端测序的。华大也没有放出对应的视频来,只能手动画一个了。
双端测序其实是基于多位置扩增(MDA)进行的,在测完read 1后,我们继续延伸read1,这样前一段DNA就会把后一段DNA顶离母链,从而暴露出primer2的结合位点。就可以再加上primer2把read 2读取出来啦。
华大测序仪现在的测序通量和测序质量已经和illmina不分伯仲了,而且测序价格还会更加便宜。截止于2019年9月29日,基于华大智造测序平台已发表的文章达到了503篇[2],受到学术界和业界广泛认可。
既然我们自己的又快又好又便宜,为啥不来用用我们自己的测序仪呢~
To be continued.
[1] https://www.mgitech.cn/article/spzx.html
[2] https://www.mgitech.cn/article/detail/cxptfbwz.html