病原宏基因组高通量测序临床本地化检测规范专家共识
中国药师协会, 中华医学会细菌感染与耐药防治分会, 国家卫生健康委临床抗微生物药物敏感性折点研究和标准制定专家委员会.
DOI:10.3760/cma.j.cn112150-20230720-00019
基于 PCR-free 建库的 mNGS 实验可在同一个空间内设置试剂准备区、标本处理区(配备生物安全柜)和建库测序区(PCR-free 建库、文库纯化、等量混合、上机测序)。PCR-free 文库浓度可能低于 Qubit 荧光定量仪的检测限,建议使用荧光定量 PCR(quantitative polymerase chain reaction,qPCR)方法进行文库浓度测定。虽然基于 PCR-free 建库的 mNGS 实验在文库定量前实验操作不存在 PCR 扩增建库所带来的气溶胶风险,但仍然需要警惕人员操作等带来的气溶胶污染可能性,并在一个相对独立的空间进行 qPCR 法文库浓度测定。
(1)湿实验应由具备分子生物学检验专业技能的人员,如分子生物学检验专业检验技师操作;
(2)干实验需要配备生物信息研发及管理人员,以保证分析流程、持续更新、性能确认、维护及管理 [12];
(3)结果审核应配备具有临床感染病学相关知识的微生物检验医师。针对疑难报告,建议成立 mNGS 报告解读团队,由具备临床感染病学、临床微生物检验学、临床分子生物学、生物信息学等相关专业知识的人员组成。所有人员均须通过岗位相关的培训和考核,并进行定期能力评估方能上岗。
核酸提取和纯化若使用手工操作,应考虑不同标本类型的差异、不同核酸提取试剂盒的提取效率、纯度以及片段大小等因素;若使用自动化核酸提取仪系统,需要综合考虑检测通量、自动化程度、成本、核酸质量等因素。
实验室应确定原始测序数据及 FASTQ 文件在服务器上存储的位置,并明确具备唯一标识的统一命名,便于数据调用与快速分类查找。文件命名建议包含数据检测/分析日期、检测实验室名称、标本类型、测序批次、唯一的标本编码等。命名规则一旦确定不得随意改动。
实验室可通过 FASTQC[19] 和 MultiQC[20] 等软件查看测序数据质量、总数据量、碱基质量值(Q20 和 Q30)等,结合测序芯片泳道上生成的簇密度设置质控点(如簇密度是否偏离有效范围,碱基识别质量值≥Q30 的数据比例是否偏低)判断本批次数据能否用于后续分析。数据过滤规则可根据实验室对 mNGS 检测的敏感性和特异性需求进行调整,建议设置 Q30 碱基数量占比>75%、有效序列长度不小于 50bp、含 N 碱基比例小于 10% 等参数阈值。
为了提高微生物数据的分析时效性,需要去除测序数据中的宿主序列,通常方法是把比对到人类基因组的序列进行过滤。真菌和寄生虫与人类的基因组序列有一定的同源性,在过滤宿主序列的过程中需要评估运行时间、去除效率与非特异性去除(非人源序列而被错误过滤)的序列比例。
物种注释是病原宏基因组检测最核心的内容之一,主要是将通过质量控制的非宿主序列与微生物参考数据库比对,或者经过从头组装成 contigs/scaffolds 后再比对到微生物参考数据库,确定在特定序列相似性阈值(如≥97%)下的物种分类级别。物种注释的准确性取决于所选注释工具的敏感性和特异性、算法阈值的合理性、参考数据库的完整性及其纳入微生物基因组的准确性 [12]。目前可用的注释工具分为三类:
(1)DNA-to-DNA 比对工具;
(2)DNA-to-Protein 比对工具;
(3)基于特征标记基因的比对工具。有研究表明,利用相同的模拟数据集测试不同的宏基因组学分类工具,发现不同的分类工具识别的物种数量可能相差 3 个数量级以上 [21]。在 mNGS 中,DNA-to-DNA 工具往往比 DNA-to-Protein 工具能够更好地进行物种分类 [22],但 DNA-to-Protein 工具在识别新发和高度可变的基因序列时敏感性更高 [23]。而在以注重物种丰度的微生物组学分析中,则推荐使用基于特征标记基因的比对工具 [24]。
总之,实验室在选择物种注释工具时,应基于检测的预期用途,从运行速度、准确率、精确率、召回率等维度评估性能 [17]。实验室可使用近缘物种的基因序列对分析软件的物种注释功能进行评估,另外在数据库或分析算法有变更时,以及定期对本实验室的 mNGS 物种/基因注释功能进行评估。
微生物参考数据库的选择显著影响物种注释分类的结果 [25,26]。《宏基因组测序病原微生物检测生物信息学分析规范化管理专家共识》[17] 中对 mNGS 常用微生物数据库的特征有较为详细的描述。目前没有任何一个公共数据库能够包含所有的潜在人类病原体的基因组信息(假阴性风险),且数据库中不可避免地存在一些注释错误或污染的序列(假阳性风险)[27]。因此在构建、使用和管理这类数据库时需要重点关注以下问题:
(1)充分评估数据库的全面性以及纳入物种在分类学上的代表性。同一微生物,往往具有遗传差异的不同亚型或株,在选择基因组时,应该考虑到微生物的遗传多样性,尽可能多地纳入不同亚型或株的高质量基因组;
(2)无论所选参考基因组的来源如何,实验室都需要通过重测序或其他技术手段确认其注释的准确性,序列的完整性,避免纳入错误注释、命名错误或代表性不足的微生物序列;
(3)病原体(尤其是 RNA 病毒)在自然状态下是不断发生变异的,所以需要及时(或定期)对参考数据库中的基因组信息进行更新及验证 [28,29],更新的频率取决于实验室或临床的需求,以及序列在公共数据库中的上传或更新时间 [28];发生可能影响结果的数据库修改、替换及更新等活动均需要重新进行评估;建议实验室每年对微生物数据库进行审核,必要时随时进行更新。但是对于使用本地化服务器的实验室,构建的数据库大小需要权衡服务器的计算能力以及报告的时效性要求。
mNGS 检测到的微生物常以读长数作为结果,但它受测序量、标本质量等因素的影响,并且同张芯片不同文库分配的下机数据量会有波动,所以有必要对读长进行归一化处理 [30]。建议将每百万测序读长中匹配到某一微生物基因组的特异读长(reads per million,RPM)作为归一化指标 [30]。如果希望比较不同微生物在同一文库中的读长,则还需考虑微生物基因组大小不同带来的差异(理论上,在相同条件下,基因组越长,测得的读长越多),建议通过计算每百万测序量下每一千个碱基的基因组长度的归一化读长来消除这种影响 [28]。需要注意,由于 mNGS 检测原理不同于 qPCR,RPM 不能作为微生物核酸的定量指标。
由于缺乏标准的 mNGS 生物信息学分析方案,各实验室自建分析流程内部使用的分析软件与数据库处在不断更新、确认及完善的动态过程中。为了保证每批次临床标本结果的可溯源性及可重复性,实验室需要明确每一次测试所使用的软件及数据库的版本,建议在报告单中体现,至少应包括分析日期、软件名称和版本号、对每个组成工具及算法的用户自定义参数和系统默认值等 [28],可使用版本管理工具如 Conda 完成 [31]。此外,可使用流程管理工具如 Snakemake 和 Nextflow 等对整个工具集进行版本控制。
(1)临床标本测序数据集:注释充分、特征明确的临床标本测序数据(FASTQ 或其他格式)[32];
(2)计算机模拟测序数据:利用序列模拟软件模拟生成测序数据集 [16,33],要求既要具有与真实测序数据质量相同/相似的技术参数(文库片段长度分布、测序模式、测序错误类型及频率、测序质量值、测序深度等)[16,34],也要尽可能对临床标本的背景成分信息如宿主核酸、微生物和试剂背景核酸等进行模拟;
(3)组合数据集:利用序列模拟软件定量模拟一种或多种目标病原体的测序数据,然后将模拟序列添加到目标病原体阴性标本的真实测序数据中,形成接近临床标本的模拟数据集 [16]。
利用上述数据开展性能确认,确定干实验流程的主要性能指标,包括准确率、精确率、召回率和 F1-Score(即精确度和召回率的调和平均值)等 [28,35]。如果在比对过程中出现寄生虫的假阳性结果(寄生虫为真核生物,与宿主序列相似度较高,且部分寄生虫基因组数据中存在人源序列的污染),需要考虑设置更高的阳性汇报阈值或者对相应寄生虫的基因组数据进行清洗。常见的寄生虫汇报阈值为与阴性对照相比 RPM 达到 10 倍以上,基因组数据清洗常采用把目标寄生虫基因组单独与人基因组比对并去除高度同源的序列 [36]。
表 1 模拟参考品示例
注:人源细胞浓度 1×10 5 cells/ml
- 批内精密度:将上述参考品在同一时间内用相同批次试剂完成 3 个全流程重复,分析批次内结果重复性。
- 批间精密度:用不同批次的试剂分别将上述参考品在 3 个工作日内完成各 3 个全流程重复,分析批次间重复性。
- 可接受标准:对阳性标本,分析结果是指通过生信流程得到的检出病原中包括该参考品中的病原体,则记为正确结果,否则为错误结果。结果一致的实验数占全部实验数比例高于 95%,判断为可接受。
- 样本选择:全流程检测不少于 20 例标本,包括 6 例阳性参考品(每例模拟混合参考品包含不少于 4 种微生物),14 例临床标本(不少于 10 例培养阳性)。分析检测结果与已知参考品的内含微生物以及临床综合判断结果是否一致,对于结果不一致的使用 qPCR 或者送至另一稳定运行的 mNGS 实验室进行差异检验。
- 可接受标准:20 例标本中物种准确性≥90%,则验证通过。对于临床标本,金标准方法和结合临床信息综合判定的病原体在 mNGS 检测结果列表之中可判定为符合。
- 浓度选择:使用阳性参考品梯度稀释至拟定的检出限浓度,可重复测定 5 次或在不同批内对该浓度标本进行 20 次重复测定(如测定 5d,每天测定 4 份标本)。可根据情况选用稀释液或阴性标本,该稀释液不得含有被验证的目标病原体。
- 判断标准:如果是 5 次重复检测,必须全部检出靶核酸;如果是 20 次检测,必须检出至少 19 次(95% 检出率)靶核酸。
- 实验过程:将投入 5~10 倍 LoD 病原体的临床模拟标本,在 4℃、-20℃冰箱分别保存 1、4、7d,在-80℃冰箱分别冻融 1 和 2 次,评估对检测结果的影响。
- 可接受标准:所有重复均检出目标病原体。
临床检测性能评价主要采用观察性研究。观察性研究中通过评价 mNGS 检测结果与临床其他参考方法结果的一致性,确认敏感性和特异性。研究应遵循《世界医学大会赫尔辛基宣言》的伦理准则和国家涉及人的生物医学研究伦理的相关要求,应当经伦理委员会审查并同意。标本量与预期用途、评价指标等多种因素相关。标本量估算通常是基于统计学要求的最低标本量估计 [41]。值得注意的是,在评价某些罕见的病原体,阳性病例的数量有限,可以引用文献报道的临床敏感性和特异性作为理论支撑 [42]。实验室可采用 “代表性病原体” 进行临床诊断性能评价 [43,44,45],比如根据临床预期用途选择不同类型的常见的病原体 [43],以期为同类病原体提供参考和借鉴。近年来已发表数篇基于脑脊液、呼吸道标本、血浆等标本类型的 mNGS 检测流程和临床性能确认的研究可供实验方案参考 [16,25,36,46,47]。
- 尽早使用:危急重症感染或局部感染不及时处理则后果严重,恐危及生命时,应在常规病原检测基础上,尽早使用 mNGS 检测辅助明确病原体 [43,59];特殊病原体感染,存在群体性感染事件风险,应在开展常规快速检测的同时,尽早使用 mNGS 检测辅助明确病原体。
- 在治疗过程中使用:高度疑似感染性疾病,但传统微生物检测反复阴性且治疗效果不佳时,考虑在完善常规病原学检测的同时或在其基础上开展 mNGS 检测;传统病原学检测的结果不能解释临床表现的全貌或/和抗感染治疗的反应,怀疑同时存在其他病原感染时,考虑在进一步完善更多病原学检测的同时或在其基础上开展 mNGS 检测;特殊患者如免疫抑制、器官移植术后、反复住院、合并基础疾病,疑似继发感染、新发感染时,考虑常规病原学检测的同时或在其基础上开展 mNGS 检测 [60,61]。
- 择期使用:表现为慢性或局部感染,或慢性疾病不除外感染,在尝试常规病原学检查未能明确致病源或/和规范性经验抗感染治疗无效时,建议在进一步完善常规病原学检测的基础上,与患者充分沟通后择期使用 mNGS 检测辅助明确病原体 [51]。
mNGS 检测技术几乎适用于所有类型的临床标本,标本的选择须结合患者情况、流行病学、病原体特性、受累器官及感染部位等状况综合考虑。怀疑高致病性、新发或突发传染病原微生物时,标本运送须经相关部门批准,严格按照《人间传染的病原微生物目录》[63] 的危害程度分类及国际民用航空组织《危险品航空安全运输技术细则》[64] 的分类包装及转运要求运输标本,如通过其他交通工具运输也应参照以上述标准 [65]。临床常见标本的选择见表 2。
表 2 mNGS 检测的临床标本类型
从无菌部位采集标本,应严格执行无菌操作,避免污染。从有菌部位采集标本,应采取相应防污染措施,避免定植或污染菌对结果的干扰。标本采集后应使用无菌、无核酸污染、带盖的专用容器,采集后封口膜密封,识别码标记,及时(建议 2h 内)送检。临床在送检时尽可能提供详细的临床信息(如患者流行病学史、感染症状体征、疑似感染灶、疑似病原体、影像学/病理学证据等)供实验室人员综合参考以便于测序数据的正确解读。标本运输过程中须防污染、防震荡,使用冷链系统转运。
法定传染病病原体:包括《传染病防治法》规定的各类传染病病原体。病原体种类应根据国家相关法律法规的修正进行及时调整。其他烈性传染病病原体:建议参考《人间传染的病原微生物目录》中对高致病性病原体的相关定义。
建议根据国家规定和验证需求将标本在有资质的实验室内进行分离培养、特异基因片段检测、特异性抗原抗体检测等方法复核。如没有剩余标本,应在做好生物安全防护的情况下进行临床重新采样,应用传染病诊断标准中规定的实验室诊断技术进行病原检测,基于病原检测结果,结合临床症状、流行病学史,依据现行传染病诊断标准进行诊断。
如患者被诊断为传染病的,按照《传染病防治法》等法律法规规定的流程上报疾控部门,并且对患者、标本等进行规范的处置。应按要求将剩余标本或重新采集标本送上级部门进行确认,并上报患者情况,同时做好必要的患者隔离措施和相关治疗工作。
若检出疑似新发病原体,应立即组织专家开展研判,尤其当疑似新病原体的序列与已知的烈性或者高传染性病原体序列相似,或者短时间内从≥2 例流行病学相关患者中检出疑似新病原体时,应立即上报有关部门。
检出法定传染病及烈性传染病病原,尤其是当检出甲类传染病(鼠疫、霍乱)以及部分传染性较强、危害较大的乙类传染病(如传染性非典型肺炎、脊髓灰质炎、人类高致病性禽流感、炭疽等)病原体,应立即对下机数据的质量,特别是比对到烈性传染病的特异性序列的准确性、读长数、基因组覆盖度等数据进行严格核实,确认可排除背景核酸污染以及特异性序列比对无误的前提下,同时启动标本复核程序。当从标本中检出明确可导致感染且能排除污染、定植微生物和背景核酸时,应报告高度怀疑该病原菌为引起感染的病原菌。患者无菌部位标本如血液和脑脊液标本中检出可疑病原菌,在无其他感染病原证据且能排除污染、定植微生物和背景核酸时,应报告为可疑致病微生物。从开放性腔道如呼吸道或可能存在皮肤定植菌污染部位的标本中检出条件致病微生物时应结合序列数、文库浓度、患者临床病史信息、感染相关指标,会同多学科专家进行讨论明确是否为责任病原体。报告单中应至少包含检出的病原微生物种属名称、唯一比对的读长数、相对丰度和室内质控数据,以及对术语、技术参数和病原微生物的注释。mNGS 报告中的病原体物种名称应标注标准的中英文名称,部分可参考的网站包括细菌网站 https://lpsn.dsmz.de/和真菌网站 https://www.mycobank.org 等。
通过耐药/毒力基因预测病原菌对抗菌药物的敏感性以及病原体的致病力,可为临床的抗感染治疗提供参考依据。但需要注意的是,不是所有的耐药/毒力基因存在即表达,可能存在基因型和表型不一致的情况;部分导致耐药/致病的机制尚无法通过检测基因来明确;目前对于耐药/毒力基因的物种归属分析技术尚未完善。因此,应谨慎开展以耐药/毒力基因来预测病原微生物耐药性和致病力。对于实验室可开展常规药敏试验检测病原菌对抗菌药物敏感性结果的药物,不宜以耐药基因结果进行预测,应以表型法药敏试验结果为准。
执笔人:
杨启文(中国医学科学院北京协和医院检验科);马筱玲(中国科学技术大学附属第一医院检验科);张建中(中国疾病预防控制中心传染病预防控制所);李轶(河南省人民医院检验科);吴文娟(上海市东方医院检验科);杨继勇(解放军总医院检验科);韩东升(浙江大学医学院附属第一医院检验科);李家斌(安徽医科大第一附属医院感染科);罗燕萍(解放军总医院检验科);周华(浙江大学医学院附属第一医院呼吸科);谷丽(首都医科大学附属北京朝阳医院感染科);张西京(空军军医大学西京医院重症医学科);李敏(上海交通大学医学院附属仁济医院检验科);单斌(昆明医科大学附属第一医院检验科);胡付品(复旦大学附属华山医院抗生素研究所);刘正印(中国医学科学院北京协和医院感染科);周海健(中国疾病预防控制中心传染病预防控制所)
主要审稿专家(按姓氏首字母顺序排列):
陈德昌(上海交通大学医学院附属瑞金医院重症医学科);冯四洲(中国医学科学院血液病医院血液科);顾兵(广东省人民医院检验科);胡继红(国家卫生健康委员会临床检验中心);刘晓琳(国家卫生健康委员会合理用药专家委员会);孙自镛(华中科技大学附属同济医院检验科);施毅(南京大学医学院附属金陵医院呼吸科);王明贵(复旦大学附属华山医院抗生素研究所);王佳伟(首都医科大学附属北京同仁医院神经内科);徐英春(中国医学科学院北京协和医院检验科);肖永红(浙江大学医学院附属第一医院感染科);俞云松(浙江省人民医院感染科);张耀华(中国药师协会);郑磊(南方医科大学南方医院检验科);郑波(北京大学第一医院感染科);卓超(广州医科大学附属第一医院感染科);周铁丽(温州医科大学附属第一医院检验科)
参考文献:略