BioTalker BioTalker

死磕大数据、智能硬件、基因检测、人工智能, 有趣有料,一切与科技有关

在2016年CSCO学术年会上,一位医生代表说,「你们肿瘤基因检测公司那么多,检测和数据处理方法又没有统一的标准,让我们医生很为难啊。」

自2012年肿瘤个人基因组检测的概念兴起以来,基于二代测序(NGS)的肿瘤基因检测公司雨后春笋般涌现。然而,由于市场准入门槛低,且缺乏业界公认的规范和标准,导致检测结果准确性差、数据分析和解读不专业等现象。我们时常会听到有医生说,「同时采集的同一个患者的血样,送到两个不同的基因检测公司,它们给出来的结果却是不一样的。」这种现象,让医生为难,让患者受害,严重阻碍了产业的发展。

101

据奇点网了解,目前国内真正掌握测序、信息分析和医学解读技术的公司屈指可数。即使在这些为数不多的公司里,它们在实验方法、信息分析和解读方法上也存在一定的差异。因此,出现上面的现象实在是在所难免。

为此,今年4月23日,中国临床肿瘤学会(CSCO)、中国肿瘤驱动基因分析联盟(CAGC)在北京发布《二代测序技术应用于临床肿瘤精准诊治的共识》(下简称《共识》),对样本处理、测序流程、数据管理、信息学分析、结果报告解释和咨询等做了说明,旨在规范NGS应用于临床肿瘤驱动基因分析的临床实践。

《共识》的出台,让二代测序技术在肿瘤精准诊疗的规范应用上迈出了第一步。然而,如何才能保证按照《共识》规范完成的检测结果是准确的?毕竟各个企业的测序平台、测序技术掌握程度、数据分析解读人员的专业程度都是存在差异的。而这些问题都隐藏在一纸检测报告的背后,几乎没办法从报告上判断检测结果的质量是否合格。

那有没有办法可以自动检测各种技术平台的测序数据质量,同时把检测结果按照统一的标准生成报告?

今年12月初,华大基因对外宣布,由华大基因首创的基于NGS非小细胞肺癌基因分析软件Oseq-T-lung获湖北省食品药品监督管理局批准上市。该软件为NGS在肿瘤基因检测应用中的信息分析过程建立了规范。

▲基于NGS非小细胞肺癌基因分析软件Oseq-T-lung
▲基于NGS非小细胞肺癌基因分析软件Oseq-T-lung

「基因测序仪可以读出基因携带的信息,这就好比X光机可以照出人体病变部位的影像。医生在诊断患者的病情时,需要患者的基因组信息和X光片信息,但是没有测序信息解读软件,医生就不知道肿瘤患者体内的基因发生了哪些变化。我们的这个软件就是用来告诉医生患者体内基因有哪些突变的。」华大基因首席科学官茅矛博士说,「这是国内高通量测序行业肿瘤基因检测方向第一个获审批通过的信息分析软件。」

据华大官方公布信息,Oseq-T-lung可以兼容多种测序平台和多种建库方法,可以直接分析从测序平台上下来的数据,全面覆盖低至0.1%水平的SNV、InDel、CNV、Fusion四种变异及MET EX14跳跃突变联合检测,特异性高于99.9%。整个信息分析环节有10多个质控点,全面保证信息分析的准确性。

「在这个行业里面,不同的医院和公司在测序平台的选择上,都有自己的战略考量,因此不同的医院和公司使用的测序技术、试剂盒和仪器都有所不同。在这些环节上,我们没办法做到强制要求大家统一。」华大基因股份有限公司研发中心副总监叶明芝博士告诉奇点网,「然而,好在每一个测序平台产生的数据类型都是类似的。于是我们就考虑,能不能找到一种方式,让医生不需要因为各种各样的测序平台,最终导致信息混乱。所以我们将信息分析流程做成规范,利用自动化分析,减少甚至杜绝人工干预的主观影响;同时将样本管理、用药信息注释和报告生成也做成自动化,减少人工操作的错误,最终将患者的突变信息以友好的界面的形式呈现给医生。

二十一世纪之初,当科学家完成人类基因组计划之后,他们又将目光瞄准了肿瘤,各个组织和机构开始开展大规模的肿瘤基因组学研究,华大基因也是其中的一员。到2012年,开始兴起肿瘤个人基因组检测这个概念,也就是在那个时候,华大开始进入这个领域,希望能利用个人基因组检测为患者寻找个性化的信息和治疗手段。

「当时我们完全是靠人查找每一个位点的资料,解析每一个位点的临床意义。两三年之后,我们发现这种重复的工作太费时费力。于是我们就把肺癌里面意义明确的突变位点绑定起来,当测序的数据流流入到软件之后,这个软件就会与后台的数据库做比较,自动解读数据。」叶明芝博士说,这是她们推出肿瘤基因分析软件的初衷。

▲非小细胞肺癌基因分析软件Oseq-T-lung的年轻研发团队
▲非小细胞肺癌基因分析软件Oseq-T-lung的年轻研发团队

「有了Oseq-T-lung之后,我们可以在数据下机后的2个小时之内完成约10个样本的数据分析。这样一来,现在我们在拿到患者的样本之后6天到5天就可以交付检测报告,」叶明芝博士说,「华大的测序仪平台可以使用此配套软件,数据从机器上下来之后,可以自动进入Oseq-T-lung,后续的数据分析也是自动完成,真正实现一键式出报告。这也满足了医院本地化检测的需求。此外,Oseq-T-lung还可以将分析好的数据直接导入到医院的数据管理系统。」

奇点网咨询了一位在报告解读领域深耕多年的专业人士,她表示,自动化解读数据最难的地方在于,在测序的过程中,有一些非常难以避免的机器和人为错误出现,这些错误被他们称为「灰区」,这个时候一般需要她们通过经验来判断某个位点是不是存在变异,并找到支持判断的证据。如果能解决这个问题,那就说明她们的软件是真厉害。

叶明芝博士告诉奇点,为了保证最终结果的准确可靠,她们在Oseq-T-lung里植入了10多个质控点。对于任何一个测序平台而言,下机的数据并不是我们经常看到的ATCG四个字母的排列,还包含了每个位点的位置信息、质量值和错误率。这些信息,构成了信息分析前的第一步质量控制。接下来还要分析测序的覆盖度、测序深度,以及捕获效率。最后软件还要对那些存在于「灰区」中的突变位点做严格的风险管控,确定这些位点确确实实是存在体细胞突变,而不是操作过程人为的污染,或者测序错误。

▲华大基因股份有限公司研发中心副总监叶明芝博士
▲华大基因股份有限公司研发中心副总监叶明芝博士

作为高通量测序行业肿瘤基因检测方向第一个获得药监局批准的信息分析软件,由于没有先例可以参考,申报的流程就显得无比艰辛。

「这个软件我们是从去年2月份开始研发的。其实在整个过程中,最难的还不是软件的开发这部分,最难的是跟药监局反复的沟通和互动,因为基因检测行业的这一块的监管一直是空白,药监局的老师和领导没有可参考的范例。所以这个过程中,我们提交了大量的资料,让药监局的负责人了解解读软件,以及它存在的逻辑和临床意义。从开始申报到拿到证书,一共花了11个月。」叶明芝博士说,「以后再有企业和单位申报类似的软件,就可以按照我们制定的标准来了。目前大家都在往这个方向努力,因为有了这个证,医生使用起来才能更放心。

一直以来,数据的分析和解读一直被看做基因检测企业的技术壁垒。在奇点网看来,数据自动分析、报告自动解读是未来的必然趋势。而标准规范的自动化分析解读方式,将成为公司获取市场的核心竞争力。华大此举抢占先机,势必给行业其他公司带来不小压力。不过,据叶明芝博士透漏,华大目前正在考虑如何将Oseq-T-lung授权给其他创业公司使用。

「我们以后应该会大大缩减在信息分析和报告解读这块的人力投入,但是这并不意味着我们不需要。因为科学在不断的发展,很多新的突变位点会涌现,也会有很多突变位点的意义不断明确,临床的治疗指南也是在不停的更新。目前机器还不会自动去跟踪分析,这个时候我们就需要人来补充。」叶明芝博士说,「未来这个领域的发展方向肯定是人工智能。」

「对肿瘤基因检测行业来说,Oseq-T-lung是第一个具有引领性的软件,它会让整个行业往规范化的方向发展。」叶明芝博士说,「我们其他癌种的软件也在开发中。预计在2017年,乳腺癌的数据分析软件会出来。」

奇点分享微信

推荐阅读

发送