病毒:熟悉却又陌生的生物
通讯作者:
作者简介 About authors
张永振,原中国疾病预防控制中心传染病预防控制所研究员,复旦大学生命科学学院兼职教授,上海公共卫生临床中心兼职教授,塞尔维亚贝尔格莱德大学医学院兼职教授。2020年被英国Nature评为年度十大人物、被美国《时代》评为全球100位最具影响力人物等。2022年荣获“穆罕默德·本·拉希德全球知识奖”,这个奖是授予全球在科学创新、知识传播等领域做出突出贡献的科学家。主要从事病毒发现、遗传进化与生态、传染病学等研究。研究结果获国际学术界高度评价,Nature、Nat Rev Microbiol、EMBO J、Trends Microbiol、eLife、PLoS Pathog、医学1000等先后配发特邀评论文章,美国普林斯顿大学等编著的经典教材Principle of Virology 2015年第四版与2020年第五版连续图文重点讲述荆门病毒发现的生物学意义。
本文引用格式
陈燕玫, 胡书剑, 吕嘉昕, 林献丹, 张永振.
随着2019年底SARS-CoV-2暴发并在全世界大流行,即便是幼童也知道了“病毒”这个名词。病毒是微小的感染子,专性细胞内寄生物,只能在其感染的宿主细胞内繁殖。19世纪末欧洲的科学家们先后发现烟草花叶病与口蹄疫是由比细菌更小的病原体引起的,因而开始认识病毒。尽管已经过去130年,但全世界发现甄别的病毒数量仍非常有限,对病毒的认识及由此构建的病毒学知识体系也主要基于那些能引起人类及具有重要经济价值动植物疾病的病毒。与对细菌、真菌、植物、动物等细胞生物的认知相比,我们对病毒的认知非常有限。除了对能引起人、动物、植物疾病的病毒认识较为清晰外,科学界对病毒的生物学地位仍存在很大的争议,对病毒的起源、它们在生命起源及生物生命过程中所发挥的作用,以及在生物圈这个最大的生态系统中所扮演的角色等知之甚少。
一、病毒种类繁多、数量庞大、无处不在,是生物圈不可或缺的组成部分
相较于细胞生物,除巨大病毒等少数DNA病毒外,绝大部分病毒的基因组相对较小且结构简单,但病毒基因组的形式复杂多样(图1)。按其遗传物质病毒可分为两大类:DNA病毒与RNA病毒。DNA病毒基因组有单链、双链、线状或环状DNA形式;而RNA病毒基因组则更加多样,有正(+)或负(-)链单链RNA、双链RNA,分节段或不分节段RNA,线状或环状RNA,以及逆转录病毒等多种形式。病毒能感染所有的细胞生物,并能利用所有已知的遗传变异机制来确保它们的生存延续,而且病毒复制具有突变率高、时间短及产量高等显著特征。在宿主体内病毒以群体(种群)形式存在,病毒种群是由一群基因组不同但相关(甚至相互作用)的动态突变体形成的集合,这个动态的突变体集合也被称为准种(注:准种这一概念最早由德国科学家、诺贝尔奖获得者曼弗雷德·艾根教授提出,现在我们经测序所获得的某一病毒序列,只是病毒种群中的其中一个突变体或复制子)。种群的大小与多样性对病毒的生存至关重要。
图1
长期以来我们对病毒的甄别主要依赖于细胞培养、形态观察、血清学及PCR等技术方法,而且偏重于发现那些能引起人及具有重要经济价值动植物疾病的病毒。然而,无论是利用细胞分离培养而后用电镜形态鉴定或血清学鉴别,还是采用PCR扩增病毒序列,这些方法均基于已知的病毒或病毒序列。再加上病毒基因组的复杂多样、不同病毒类群间的巨大差异,以及许多病毒只能在宿主细胞或有限类型的细胞中复制繁殖等,甄别病毒费时费力,更不容易发现那些与已知病毒差别很大的病毒。因此在过去的100多年间,全球发现甄别的病毒数量有限。1971年国际病毒分类委员会(ICTV)发布第一次报告时命名确认了290种病毒,1982年发布的第四次报告确认了1372种病毒,2011年发布的第九次报告也仅确认了2284种病毒。近10年来,随着将宏基因组学技术(尤其是宏转录组学技术)运用于病毒发现,以及病毒分类规则的不断完善,新病毒发现的速度加快,病毒总数快速增加。至2022年8月,ICTV确认的病毒数量已达到 10434种。
因为病毒发现的数量有限,而病毒的基因组又是如此复杂多样,不同种类病毒间差异巨大,似乎不是来源于一个共同的祖先,所以长期以来科学界对病毒的起源没有统一的意见。有关病毒的起源主要有如下假设:病毒是多系的;病毒起源于细胞之前,可能是细胞微生物的前身;病毒是在细胞形成之后产生的。另一个与生命起源有关又涉及病毒生物学地位的科学问题是:病毒是有生命的有机体(living organisms)吗?它们是否应该在生命之树中占有一席之地?是否应将它们看成生物界中的第四个域?如果鉴于现有对生物的定义:能够自我维持复制、自己制造能量(代谢)、对刺激产生应答、进化、能够在环境中维持其稳定等,显然病毒不具备所有这些特征。然而,地球上所有的生命都是绝对相互依存的,没有任何生物是完全独立于其他生物的。目前普遍认为地球上RNA的出现早于DNA;RNA基因组也仅在病毒中发现。另外,在三个生命域(真细菌域、古核细菌域和真核生物域)生物中发现的病毒其基因组都具有相同的结构和编码特征。2003年发现的巨大病毒[注:即布拉德福德球菌(Bradfordcoccus)被鉴定为巨型病毒(Acanthamoeba polyphaga mimivirus)]模糊了病毒与细菌之间的界限,也再次引起有关病毒生物学地位的激烈争论。正如上述,病毒的基因组复杂多样,有些病毒的基因组约1~3 kbp、仅编码一个基因;而巨大病毒的基因组可达2.5 Mbp、编码超过2500个基因(注:超过立克次体等细菌)。病毒是否可以被认为是有生命的生物取决于对生命的定义,这似乎也是一个哲学问题。鉴于生命最重要的属性——遗传与进化,生命更像是由一个连续的基因集合所表现出来的特征,这些基因集合能够在它们的生态位内复制繁衍。因此,笔者更倾向于病毒是一类有生命的生物,可能出现在第一个复制子到细胞形成的中间阶段。
鉴于RNA病毒突变率高、多样性强,过去20年中新发突发传染病的病原体又以RNA病毒为主,2013年我们团队开始探索基于宏转录组学技术检测样品中的所有RNA建立新的病毒发现体系,希望发现与识别更多的RNA病毒。与DNA相比,RNA更容易降解,这就要求我们从样品的采集、运输、保存、实验室内样品处理、RNA提取、上机测序、数据分析判断等建立一套完整的标准体系,确保样品中的RNA不被降解,能发现与识别样品中的RNA病毒,获取病毒的完整信息。经过多年的努力,我们不但建立了完善的新病毒发现体系,且由于检测的是样品中的所有RNA,这套体系同时能检测DNA病毒、细菌、真菌、寄生虫等病原体,做到了病原体筛查的全覆盖一体化。借助这套病毒发现体系,我们于2013年发现了具有重要生物学意义的荆门病毒;2015年从70种节肢动物中发现了112种负链RNA病毒;2016从220种无脊椎动物中发现了1445种RNA病毒;2018年从186种低等脊椎动物中发现了214种RNA病毒。加上在哺乳动物等发现的RNA病毒与DNA病毒,我们团队在过去10年间从各类动物中共发现了2300余种全新动物病毒,充分说明了病毒在动物中的多样性与普遍性(图2)。
图2
在这些新发现的RNA病毒中,荆门病毒与楚病毒具有重要生物学意义,秦病毒、赵病毒、魏病毒、燕病毒等在分类上处于重要位置。荆门病毒的基因组由4个基因节段组成,其中编码非结构蛋白的两个基因节段与黄病毒具有较高的同源性,但编码结构蛋白的两个基因节段与当时所有已知的病毒无同源性。荆门病毒是世界上首个被发现的能将基因组分节段与不分节段两类病毒建立起遗传进化关联的病毒。正因为其重要的生物学意义,美国普林斯顿大学等编著的经典教材《病毒学原理》2015年第四版与2020年第五版连续图文讲述荆门病毒发现的故事。楚病毒的基因组不但有分节段与不分节段两种形式,而且无论是分节段还是不分节段的基因组都有线状和环状两种形式,是世界上已知基因组最复杂多样的RNA病毒,也是世界上发现的第一个具有环状基因组的RNA病毒,同时还是将基因组分节段与不分节段负链RNA病毒建立起遗传关联的病毒。荆门病毒、楚病毒、秦病毒、赵病毒、魏病毒、燕病毒等全新病毒的发现不但填补了病毒进化上的空白,而且展现了RNA病毒进化上的连续性,这也证明了所有RNA病毒起源上不是多系的,具有共同的祖先。从海洋鱼类中发现的沙粒病毒类、汉坦病毒类、埃博拉病毒类病毒具有与哺乳动物携带的同类病毒同样的基因结构特征,证实了RNA病毒漫长的进化历史。借助这些新发现的病毒,我们系统阐明了RNA病毒的进化规律,重新界定了RNA病毒圈。另外,我们在动物中不但发现了缺少编码核蛋白基因或糖蛋白基因的RNA病毒,甚至发现了同时缺少编码核蛋白与糖蛋白基因、仅保留编码RNA依赖的RNA聚合酶基因的RNA病毒,这些病毒的发现提出了什么是“病毒”的问题,也让我们开始思考它们是否是生命起源过程中最早出现的复制子。
自19世纪末发现第一个病毒至今,人类基本上都是在研究人、动物与植物所携带的病毒,几乎无人研究作为各种生物“家园”的土壤,池塘、沟渠、江河与湖泊的底泥,海洋沉积物等相关环境中的RNA病毒的多样性及组成。它们在环境中的属性是什么?影响他们多样性及其组成的生态环境因素有哪些?为了回答上述科学问题,我们于2015-2019年间从中国16个省区以及包括西沙、南沙、黄岩岛等广泛的南海海域的32个不同环境中采集了土壤、底泥、沉积物、这些环境中的家养和野生动物的粪便等样本。从中发现了符合ICTV种分类标准以上的新病毒约2700种,分布在至少62个病毒科中。新发现病毒的基因组包含所有已知RNA病毒的基因组结构形式。另外,这些环境中也存在着大量已知病毒。这些研究结果证明从陆地到海洋等各种自然环境中RNA病毒的多样性与广泛性,病毒是陆地和水生生态系统重要的、不可或缺的组成部分(图2)。
在各类环境样本中,病毒的丰富度以沉积物和动物粪便中最高。生境中的有机物含量、真核生物的物种丰度等地理生物因素影响着当地环境病毒组的组成及其丰度。环境因素对细菌、真菌和植物病毒的多样性及其丰度的影响显著高于其对动物病毒组的影响,这表明细菌、真菌和植物病毒对其相应生境的适应性。另外,也可能是动物具有更大的流动性,使它们有能力在不同环境之间“转移”病毒,从而模糊了环境对病毒组的影响。这说明病毒宿主及其生境决定了特定环境中病毒的多样性及其组成。
自然界中到底有多少病毒?若一种细胞生物携带一种病毒,仅节肢动物所携带的病毒就有百万种之多。因此,笔者认为,病毒是生物圈中最丰富多样的生物及重要的组成部分,对维持生物圈这个最大生态系统的平衡及生命的延续具有重要意义。
二、人类能否像预报天气那样主动预报预警病毒性新发传染病
历史上病毒引起的疾病对人类危害巨大。在20世纪仅天花就导致了3亿多人死亡,是同期因战争死亡人数的两倍多。尽管通过接种疫苗等防治措施,人类已有效控制甚至消除了部分病毒性传染病(如天花、脊髓灰质炎、麻疹、狂犬病等),但仍然面临着不断出现的新发传染病所带来的巨大挑战,如艾滋病、流感、埃博拉出血热、冠状病毒引起的人严重呼吸道疾病,以及未知的X疾病等。随着全球社会经济的发展、人类社会行为及气候生态环境的不断改变,新发传染病必将像极端天气一样不断出现。那么,我们能否像预报天气那样对新发传染病进行主动预报预警(图3),从而避免或减少它们的危害?
图3
现在对天气的预测预报越来越精准。精准的天气预报离不开长期监测;利用卫星和雷达等高科技手段查清了那些与天气变化相关的气象因子,掌握了它们的变化规律;建立了数学物理模型,基于长期监测的数据及实时动态变化,利用超算进行分析,由此实现对天气的精准预报(图3)。人的传染病主要来源于自然环境,受社会因素影响。鉴于病毒等病原体及其宿主的生物学属性,它们在生物圈中的多样性、广泛性及复杂性,若要预测预报它们会在何时何地以何种方式在人群中出现甚至暴发流行,我们需要建立系统的监测网络,查清病毒及其宿主在自然界中的本底与分布,明确其中哪些可能引起人类疾病?揭示它们与宿主间的关系、在宿主中的遗传进化与生态规律、在宿主间的播散规律及其影响因子、病毒与病毒间及病毒与其他微生物间的相互作用,以及影响病毒进化与播散的自然因素及社会因素(图3)。
建立新发传染病的预报预警系统既涉及生物因素,又与社会因素紧密相关,一定比建立天气预报系统更复杂困难。即便暂时还不能实现对新发传染病的精准预报预警,是否可以在它们出现之初便能发现并做出精准判断(病原体是什么、生物学属性、传播途径、致病性等),立即提出并采取精准的防控策略,把它们的危害控制在最小范围甚至将它们消灭在萌芽状态。2019年底武汉发现不明原因肺炎病例后,基于我们早在2015年就开始的不明原因肺炎病原谱研究项目,2020年1月3日下午1点半我们收到武汉合作伙伴送来的一位重症不明原因肺炎患者的呼吸道灌洗液标本。采用上述病原体全覆盖一体化筛查体系,我们用不到36个小时就确认了病原体、在42小时内获得了病毒的全基因组序列并完成了相关的分析,进而借助临床信息做出了正确判断:引起此次不明原因肺炎的病原体是SARS类冠状病毒、在病毒分类学上该病毒是一种新型冠状病毒、该病毒经呼吸道传播、致病性高于高致病性禽流感病毒。另外,早在2010年春我们团队对2009年我国河南与湖北交界地区出现的不明原因出血热疫情进行解析时,用不到两周的时间采用PCR方法鉴定出病原体为一种新型布尼亚病毒,随后又用不到两周的时间发现长角血蜱是其宿主与传播媒介。能把这些不明原因疾病的病原体快速鉴定出来并能做出精准判断都是基于我们长期开展新病毒发现、遗传进化与生态学、播散规律,以及传染病流行病学等基础研究所积累的认识。从这些案例及国内外其他研究团队的成功案例不难看出:现阶段人类社会虽然还不能提前精准预报新发传染病在何时何地以何种方式暴发流行,但已基本具备了在暴发早期发现病原体并做出精准判断的能力。
综上所述,自然界中病毒具有高度的多样性与广泛性,无处不在,是生物圈不可或缺的组成部分,对生物圈的持续平衡发展可能发挥着无可替代的重要作用。其中能引起人与动植物疾病的病毒只是其中的一小部分,病毒不等于病(病毒≠病)。尽管历史上病毒给人类带来了巨大灾难,未来新发传染病的再次出现也不可避免,但只要不断从多个维度加深对它们的认识,相信我们终将能像预报天气那样对新发传染病进行预报预警,采取更加主动的防控措施,减少或避免它们对人类的危害,充分发挥它们对生物圈持续平衡发展及在生命过程中的积极作用。