昆禾头条

宏基因组学技术 宏基因组病原体检测火起来后

日期:2019-12-07 来源:宏基因组学技术 评论:

[摘要]本文转载自“动脉网”。2019年,宏基因组病原体检测彻底火了起来。早前,新一代基因测序技术(NGS)的拥护者们刀耕火种般开辟临床市场,一点一点将NIPT打造成点石成金的产品后,构筑了难以撼动的市场格局。而后,肿瘤基因检测产品急迫希望将NIP...……

本文转载自“动脉网”。

2019年,宏基因组病原体检测彻底火了起来。

早前,新一代基因测序技术(NGS)的拥护者们刀耕火种般开辟临床市场,一点一点将NIPT打造成点石成金的产品后,构筑了难以撼动的市场格局。而后,肿瘤基因检测产品急迫希望将NIPT的成功如法炮制,却留下兵荒马乱得让投资人们审美疲劳的局面。

如今,宏基因组病原体检测的出现,似乎打开了未来的一扇门。它严格采用了NGS临床应用的全套流程,无需验证基础技术的可行性,同时,它弥补了传统微生物检测阳性率极低的技术短板,面对的是抗生素监管之下广阔的市场空间。

国内最早开展这项业务的华大基因在年中发布的2018年财报上显示,其感染防控业务营收同比增速位列各大业务条线前三。新晋明星企业金匙医学今年初逆势获得资本热捧,另有多家投资机构都提及正在密切关注金匙医学的发展。各家基因检测企业在宣传上频频将产品线向宏基因组病原体检测靠拢,都在讲述宏基因组病原体检测真的火起来了的故事。

然而,当我们选择用数据说话时就会发现,尽管各家宏基因组病原体检测产品已经累计卖出三万多份,宏基因组病原体检测产品在临床微生物检测中的转化率仍然非常低。换言之,真正在临床上落地的宏基因组病原体检测产品非常少。

在本文中,动脉网采访了北京大学第一医院感染疾病科主任王贵强教授、金匙医学CEO蒋智博士、君联资本戚飞博士和一些从业者,希望能够从著名医生、领军创业者、已布局这一赛道的投资人等多个角度,找出宏基因组病原体检测概念与产品冰火两重天之下,阻碍产品落地的技术难点,探索宏基因组病原体检测未来真正的应用前景。

宏基因组病原体检测的正确打开方式

宏基因组测序是一项科研服务中非常成熟的技术,在土壤微生物检测中常被用到。直到2014年,英国科学家通过宏基因组辅助检测治愈了一位原因不明、反复发热、具有癫痫及脑积水症状的14岁男孩的案例,才开启了全球范围内宏基因组临床应用的探索。在国内,华大基因首次引入临床病原体诊断,并在2016年完成全球首例神经性布氏杆菌病(NB)感染检测,让国内外宏基因组病原体检测有了近乎同步的临床进展。

宏基因组病原体检测是对感染标本直接进行高通量测序,通过专门的病原数据库比对,获得疑似致病微生物的种属信息,并提供能够指导临床治疗的分析报告,为疑难危重感染提供快速精准诊断依据。

微生物包括细菌、真菌以及一些小型的原生生物、显微藻类等在内的一大类生物群体以及病毒,涵盖有益与有害的众多种类。临床微生物学的范畴包括微生物诊断学和临床样本的病原学识别,以指导感染性疾病患者的管理和治疗策略,以及公共卫生微生物学、社区感染性疾病报告的监督和监测。

根据提取核酸的种类不同,宏基因组病原体检测分为DNA检测流程和RNA检测流程。DNA检测流程适用于胞内寄生的细菌如结核分枝杆菌、细胞壁较厚的真菌如隐球菌等病原的检出。RNA检测流程适用于流感病毒、呼吸道合胞病毒、冠状病毒等RNA病毒的检出。疑似RNA病毒感染时,需要选择RNA检测流程。

在临床操作用,宏基因组病原体检测需要经过采集感染部位样本、提取核酸、高通量测序、生物信息分析、出具检测结果和报告解读等环节,具体流程如下图所示:

宏基因组病原体检测流程

据蒋智博士透露:样本处理、数据库构建和生信分析是宏基因组病原体检测中至关重要的环节。

其中,样本处理最为关键,并且难度最大,需要保证核酸完整、保存方式妥当。当用于科研服务中时,核酸提取完整度通常做到80%即可,临床上则需要尽可能100%提取。“往往病原检出阳性的可能性,就存在于没有被提取到的核酸中。”因此,优化核酸提取工艺和保存条件是宏基因组病原体检测企业需要攻克的难题。

而真正制约宏基因组病原体检测商业化的重要因素是参考数据库的构建。由于没有满足完整需求的公共数据库,宏基因病原体检测企业需要基于公共数据库的数据清洗和本身案例积累,建立自身的数据库。其中,参考数据库构建的技术难度并不大,但工作量惊人。仅所搜集的文献和测序数据,就相当于一个至少10人博士团队1年的工作量。

与科研服务只需要提供数据报告不同,宏基因组病原诊断需要提供医生能够理解的检测结果,而检测结果的准确性在一定程度上取决于参考数据库的可靠和适当    。

金匙医学创始人蒋智博士认为,宏基因组病原检测的流程和数据库靠谱只是开展这项业务的基本前提,产品打磨不能缺少临床专家的参与,临床研究积累在报告解读规则制定中发挥重要作用,“宏基因组病原体检测企业应该加强与临床专家的合作,通过实打实的案例积累,共同打磨产品。”

诚然,需要样本积累到一定数量,才能得到足够多的准确阈值,以确定何种情况属于病原阳性,减小模糊区间。现阶段,检测结果通常依托宏基因组病原体检测企业的经验做判断。蒋智博士认为,出现这种情况,一方面是样本积累数量不足,另一方面是临床参与度不够,需要联合临床专家开展足够多的高质量临床试验,提高结果的可用性,并且把临床符合度作为评价产品的最重要指标。

动脉网调查后发现,目前市场上有很多原本从事肠道微生物检测的企业,也在对外提供宏基因组病原体检测服务。但实际上,肠道微生物检测与宏基因组病原体检测间存在明显差异,前者侧重于科研服务和健康人群,输出类型为数据报告,而后者用于临床诊断,需要输出严谨的检测报告。此外,肠道微生物检测所采集的样本中,会混入少量脱落的人体细胞,但提取到的仍以微生物核酸为主,但病原微生物检测样本中混入的背景人体核酸则较多,样本处理和文库构建的难度更大。

病原体诊断的金字塔尖市场

这是本次接受动脉网采访的几位业内人士对宏基因病原体检测现阶段市场规模的共同判断,在将宏基因组病原体检测与传统病原体检测进行优劣势对比后,我们找到了宏基因组病原体检测产品落地困难的其中一个原因。

宏基因组学技术 宏基因组病原体检测火起来后

MiSeq 受制于它的通量 (up to 15 Gb in 2 × 300 mode),但仍然是目前 single-marker-gene microbiome studies 的金标准

ExPecto可以从200多种组织和细胞类型中预测基因表达水平和序列的变异效应

DeepSEA除了可以预测非编码元件变异的功能结果,还可以用于自闭症谱系障碍的调节变异的研究。

同种细菌的不同菌株,它们的基因组组成很相近,常常就是一个碱基的变异或者整个基因/操纵子的丢失,当进行 de Bruijn 图组装时,就会在这些差异的位置出现分叉,组装工具在遇到这些分叉时,常常会停在这些位置,从而导致一个个不连续组装片段的产生。

OrthoFinder默认使用DendroBLAST发育树,也就是根据序列相似度推断进化关系。这是作者推荐的方法,在损失部分准确性的前提下提高了运算效率。当然你可以用-M msa从多序列比对的基础上进行基因树构建。如果你先用了默认的DendroBLAST,想测试下传统的MSA方法,那么也不需要重头运行,因为有一个-b参数可以在复用之前的比对结果。

ChIA-PET是一种整合了免疫共沉淀(ChIP), 染色质铰链(chromatin proximity ligation),双末端标签(Paired-End Tags)以及高通量测序研究基因组范围内染色质远程交互的技术。单凭这些拗口的名词我们很难理解该方法的精髓,不妨看一下具体实施步骤。如图1,整个流程大致分成8步,

previously uncharacterized microbes are difficult to profile

进过一系列的实验处理和测序,我们得到来自空间上相互靠近的DNA片段reads,类似于Chip-Seq,研究人员基于ChIA-PET技术开发出了专门的生物信息学工具。2017年1月,清华大学在《核酸研究》上发表了一款名为CHIA-PET2的分析软件(github地址为:https://github.com/GuipengLi/ChIA-PET2),旨在全方面处理多种类型的ChIA-PET数据。如图2,描绘了CHIA-PET2的数据处理流程。CHIA-PET2支持Bridge linker和Half-linker两种ChIA-PET文库,包含perk calling和loop detection算法。

基于reads binning的优势是可以聚类出宏基因组中丰度非常低的物种

3. Sample collection/preservation

之后是MMseqs2, 一个蛋白搜索和聚类工具集,相关文章发表在NBT, NC上。GitHub地址为https://github.com/soedinglab/MMseqs2

OrthoFinder2在OrthoFinder的基础上增加了物种系统发育树的构建,流程如下

使用分布式 assemblers,例如 ABySS、Ray

用 de Bruijn 图方法进行宏基因组的从头组装时,面临着以下的挑战:

4. Biomass/Contamination

DOI: https://doi.org/10.1038/s41588-018-0295-5

原标题:功能基因组学研究利器——ChIA-PET

例如,鉴定出微生物群落中的抗生素抗性基因,该方法高度依赖特定功能相关基因集注释的质量。

目前主流的 bining 策略利用的是 contigs 的序列组成特点。

Meta-IDBA:将图依据其拓扑结构拆分成各个元件,每个元件代表各个亚种的共有区域

不同诊断方式对比(动脉网根据公开资料整理)

简单分析可以发现,宏基因组病原体检测最大的优势在于检测通量。与常规检测手段在单次检测中只能针对特定的单种或数种微生物不同,宏基因组病原体检测基于其底层技术的高通量优势,能够根据所采用产品对比的参考数据库大小一次性检测出样本中几乎所有种类的病原微生物。

同时,宏基因组病原体检测的前处理环节只涉及核酸提取和文库构建,不存在培养中出现的时滞,能够更好应对危重情形下的病原诊断需求。

而宏基因组病原体检测动辄数千元的费用,在门诊的简单病原诊断中并不具备优势,这显然不利于宏基因组病原体检测产品在临床市场中推广。

此外,尽管宏基因组病原体检测产品在中枢神经系统感染等相对成熟的领域病原检出阳性率已经高达50%~60%。但在血流感染中,主流的临床宏基因组学产品阳性率只有30%左右,前者在重症感染中占比高达70%~80%。病原检出能力在不同感染中并不相同,无疑也是目前制约宏基因组病原体检测产品在临床落地的重要原因。

第三个层面的原因在于,病原诊断在院内属于相对冷门的项目。一方面,相比于发病率极高的病毒性肝炎治疗集中的临床资源供给,细菌、真菌诊疗并不属于感染科中比较主流的领域;另一方面,细菌、真菌诊断操作复杂繁琐,成功率低,医生采用积极性很低。

基于现有诊断手段,如血培养、PCR等只能在近三千种具有明确临床价值的菌种类别中做匹配,“送检样本中病原检出平均阳性率不足20%,远不能满足临床治疗的需求,提高病原诊断率是目前感染病临床治疗的突破点。”北京大学第一医院感染疾病科主任王贵强教授指出。

在我国,每年有超过10亿人次发生感染,其中的绝大多数常见感染通过经验性的治疗和常规的检测手段都能解决。据统计,每年有约2000万人发生疑难、危重感染,这部分感染属于诊断的空白地带,宏基因组病原检测进入的正是这一领域。

实际上,近年来国家高度重视细菌、真菌诊断能力提升,实现抗菌药物的合理使用。2016年8月,国家卫生计生委、发展改革委等14个部门联合印发了《遏制细菌耐药国家行动计划(2016-2020年)》,强调二级以上医院细菌真菌诊疗能力提升和抗菌药使用管理的多学科诊疗模式,希望在改变滥用抗生素现状中引入专业、先进的诊疗手段。

王贵强教授告诉动脉网,医院端存在提高病原诊断能力的可观需求,对宏基因组病原诊断等先进技术接纳程度非常高。王教授本人也正在密切关注病原快速诊断、宏基因组病原诊断等多项前沿技术的落地。

细菌培养已经远远满足不了临床需求,亟需新技术在临床转化,包括NGS、三代测序、快速诊断等,我们已经将病原快速诊断和宏基因组病原体检测用于消化系统、中枢神经系统、呼吸道、血流感染中临床亟待解决的难题。王贵强教授表示,推动前沿病原诊断项目在临床上转化落地,是他最近两年来非常重要的工作内容。

商业化瓶颈:更长读长、更低价格

至此,本文已经分析了宏基因组病原的正确打开方式和临床落地中存在的阻碍,我们认为,宏基因组病原体检测在优化检测流程和降低检测成本后,将逐渐走下金字塔尖,成为数十亿人次的病原诊断市场中常规的检测手段。

从本质上讲,宏基因组病原体检测需要高通量、高灵敏度,才能在巨大的背景信号中找到微量的病原序列。

一方面,现有的mNGS病原体检测主要基于短读长的测序平台完成,需要长度长的测序结果,PCR-free文库构建,实时长度长测序,压缩测序时间,贴合危重感染对于检测时效性的高要求,这些都是临床的需求和未来的趋势。不过,三代测序的临床应用在未来2~3年内是很难实现的。

另一方面,尽管从2008年到2014年,人类基因组测序的成本已经从百万级下降到千元级,随着测序通量增加和更多玩家进入,成本还将继续下降。

随着检测流程和检测成本的不断优化,mNGS未来会逐渐取代部分常规检测,通过读取更长读长的基因序列数据,实现耐药、毒力和更精准分型的判断,随着仪器不断小型化,未来将可能作为床旁使用工具。

抗感染药物是全球最大的用药市场之一,覆盖了最多的用药人群和用药频次。但是由于治疗习惯的不同,国内病原微生物检测产品采用率远低于国外,君联资本戚飞博士认为,阳性率更高的宏基因组病原体检测产品的出现,能够为脑炎、脑膜炎、脓毒血症等不明原因的重症感染等场景提供解决方案,提高临床上抗感染药物的用药精准程度。

而对于宏基因组病原体检测行业的成熟期估算,戚飞博士认为至少需要3~5年。尽管宏基因组病原体检测市场需求切实存在,国家对于抗生素滥用的限制性规定也会促进行业发展,但在国内的抗感染、抗菌药物使用环境下,这个方向不会一蹴而就地体现在临床实践中,还需要产品打磨和市场教育,“市场的成熟需要时间和从业者的共同努力。”

“宏基因组病原体检测行业可能不会出现如肿瘤基因检测行业那样一拥而上的局面。”在以往,资本入局可能会在一定程度上“拔苗助长”式催熟产业,但宏基因组病原体检测产品在技术优化和生信服务都需要做到更进一步,切实解决临床未满足需求是企业的核心任务,不太具备被资本快速成熟的特质,需要通过真实的临床案例积累和切实的市场教育来逐渐做大市场蛋糕。

戚飞博士也提到,宏基因组病原体检测已经累计了多家医院和企业数万例临床应用,临床医生也越来越多的认识到这个技术的价值,加上目前初始阶段从业者们在参考数据库构建、市场教育等方向上的持续耕耘,行业成熟更多是时间上的考量。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

宏基因组学技术 我们访谈了这个行业的先行者

建议:参考前人在类似环境中的研究。若没有可参照的类似研究,选择marker gene做预实验

在进行宏基因组研究时,往往很难找到与目标样本集对应的没有其他干扰因素的对照组

日期:2019年2月2日——2019-Week5

当前采用的基于测序的方法具有很高的灵敏度 (highly sensitive),即使非常微量的DNA也能被检测出来。而实验室中使用到的常规仪器和试剂并不是无菌的,这样就很可能在实验操作过程中,人为地引入污染。由于检测方法的高灵敏度,当原样本的微生物量很少时,污染带来的信号很可能会盖过真实的信号。

中心成立后,聚焦于绿色生态及人体健康、器官衰老等领域的产品开发与科技创新研究,主要在检测基因多态性和基因突变、安全性评价、筛选毒物、细胞命运的基因调控机制等领域开展研究。

此外他还能分析所提供物种的系统发育树,将基因树中的基因重复事件映射到物种树的分支上,还提供了一些比较基因组学中的统计结果。

谈论到直系同源基因分析的时候,大部分教程都是介绍OrthoMCL,这是2003年发表的一个工具,目前的引用次数已经达到了3000多,但这个软件似乎在2013年之后就不在更新,而且安装时还需要用到MySQL(GitHub上有人尝试从MySQL转到sqlite)。

Jha, A., Gazzara, M. R. & Barash, Y. Integrative deep models for alternative

拼接和基因预测算法往往需要耗费大量的运算资源,而很多近似或高速算法往往以牺牲准确性作为代价。因此,如何在保证准确性的前提下提高速度是决定宏基因组分析质量的关键

DNA提取的效果会直接对后续的实验和分析产生巨大的影响。DNA提取方法的选择依赖于样品中细胞类型的组成,然而即使是相同类型的样品其微生物组成也具有较大的差异(当人粪便中革兰氏阴性菌主导时,细胞很容易裂解,而当由相对顽强的革兰氏阳性菌主导时,则相反)。

测序有望彻底改变癌症、未确诊的罕见遗传病及进行性疾病(如阿茨海默病)的治疗方式。对于Evelyn等孩子来说,生活从此变得不同,他们如今也有机会过上健康长寿的生活。而作为Illumina的一份子,我们很荣幸能够推动这些进步,让全世界的广大民众受益。

Gene family abundances are calculated as weighted sums of the alignments from each read, normalized by gene length and alignment quality.

enable profiling of low-abundance organisms that cannot be assembled de novo

Illumina测序仪通量大 (up to 1.5 Tb per run),且准确率高 (with a typical error rate of 0.1–1%),通过在不同样本的序列上添加两重barcode,可以一次测序多个samples。

神经网络的起点是一个人工神经元,它以一个实数向量作为输入,然后计算这些值的加权平均值,然后进行非线性变换,可以得到一个简单的阈值。权重是训练期间学习的模型参数。神经网络的力量源于高度模块化和可组合单个神经元,一个神经元的输出可以直接作为另一个神经元的输入,神经元组合起来就形成一个神经网络。

Meta-IDBA handles this problem grouping similar regions of similar subspecies by partitioning the graph intocomponents based on the topological structure of the graph. Each component represents a similar region betweensubspecies from the same species or even from different species. After the components areseparated, all contigsin it are aligned to produced a consensus and also the multiple alignment.

记者了解到,该中心以基因组学为特色,目前设有表观遗传学、肠道微生物、常见慢性病及肿瘤遗传病因诊断、细胞培养等五个实验室。现有教授、副教授等专职研究人员5人,全部具有博士学位,并由马来西亚科学院陈国银院士领衔并兼任研究中心主任。

splicing. Bioinformatics 33, i274–i282 (2017).

effects on expression and disease risk. Nat. Genet. 50, 1171–1179 (2018).

您至少需要输入5个字

相关内容

编辑精选

copyright © 2017 https://www.kunhecar.com 昆禾头条 版权所有