导读:伦敦大学学院从系统发生学估计,新冠大流行开始时间可能在2019年10月6日至2019年12月11日左右之间,这也对应于自然宿主“跃入”人类的时间。该病毒仅在2019年底才出现,然后迅速传播到全球。
来 源丨21世纪经济报道(ID:jjbd21)
记 者丨卢杉
编 辑丨李清宇
当地时间5月5日,一项题为“Emergence of genomic diversity and recurrent mutations in SARS-CoV-2”以预审的方式在线发表在《感染,遗传学和进化》(Infection,Genetics and Evolution)上。
该研究团队来自伦敦大学学院(UCL)。5月6日,UCL官网发布了关于这项研究的新闻:SARS-CoV-2中的突变提供了有关病毒进化的见解。
研究小组通过分析7500多名感染了新冠肺炎(Covid-19)的人群的病毒基因组,确定了SARS-CoV-2病毒基因组多样性的特征。监测SARS-CoV-2中遗传多样性的积累和模式有可能为药物和疫苗开发的目标提供信息。
由UCL遗传学研究所牵头的这项研究确定了该病毒中近200个复发性基因突变,突出了该病毒为了人类宿主如何适应和进化的可能性。
“根据对公共基因组装配的大规模分析,SARS-CoV-2基因组中的198个位点似乎已经发生了反复的独立突变。检测到的复发性突变可能表明SARS-CoV-2正在不断适应其新型人类宿主。”
新冠病毒或始于去年十月
研究人员发现,SARS-CoV-2的全球遗传多样性中有很大一部分是在所有受灾最严重的国家中发现的,这表明从流行初期就开始了广泛的全球传播,而且在大多数国家中没有单一的“零号患者”。
在包括英国在内的许多国家,采样病毒的多样性几乎与全世界所看到的一样多,这意味着该病毒是独立多次进入英国的,而不是通过任何一个指数案例。
研究人员从系统发生学估计,新冠大流行开始时间可能在2019年10月6日至2019年12月11日左右之间,这也对应于自然宿主“跃入”人类的时间。该病毒仅在2019年底才出现,然后迅速传播到全球。
“这一研究排除了新冠病毒可能早在被发现很长时间之前就已经在传播、进而已经感染了大部分人口的任何假设。”来自UCL遗传学研究所的联合首席作者Francois Balloux表示,“所有病毒都会自然变异。突变本身并不是一件坏事,没有任何迹象表明SARS-CoV-2的突变比预期的快或慢。到目前为止,我们还不能说SARS-CoV-2是否正在变得或多或少地具有致命性和传染性。”
研究人员称,识别出的微小遗传变化或突变未在病毒基因组中平均分配。由于基因组的某些部分几乎没有突变,病毒的那些不变部分可能是药物和疫苗开发的更好靶标。
抵抗病毒的主要挑战是,如果病毒突变,疫苗或药物可能不再有效。“如果我们将精力集中在病毒中不太可能发生突变的部分上,那么我们就有更好的机会开发出从长远来看有效的药物。”Balloux解释说,“我们需要开发不能轻易被病毒逃避的药物和疫苗。”
共同首席作者Lucy van Dorp博士(UCL遗传学研究所)补充说,“病毒之间的遗传差异或突变仍然很少。我们发现其中一些差异已经在大流行过程中多次出现,彼此独立发生–随着更多基因组的可用,我们需要继续监测这些差异,并进行研究以确切了解它们的作用。”
该研究小组开发了一种新的交互式,开放源代码在线应用程序,以便全球研究人员还可以查看病毒基因组,并应用类似的方法来更好地了解其进化过程。
Lucy van Dorp表示,“能够在大流行的头几个月内分析如此大量的病毒基因组,对于药物开发工作可能是无价的,并且展示了即使在过去十年中,基因组研究已经走了多远。全球数百名研究人员的巨大努力使我们都受益匪浅,他们一直在对病毒基因组进行测序并将其在线提供。”
该论文详述了上述核心观点。
图片来源 / 图虫
SARS-CoV-2的变化
SARS-CoV-2是一种可能是人畜共患病源的SARS样冠状病毒,于2019年12月在中国湖北省省会武汉市首次发现。此病毒已在全球传播,导致当前正在进行的COVID-19大流行。第一个完整的基因组序列于2020年1月发布,自该日期以来已对数千个基因组进行了测序。
该资源提供了对SARS-CoV-2过去人口统计资料的空前洞察力,还可以监视病毒如何适应其新型人类宿主,为直接设计药物和疫苗提供信息。我们策划了7666个公共基因组装配的数据集,并分析了随着时间的流逝基因组多样性的出现。
我们的结果与之前的估计相符,并指出了到2019年底所有具有共同祖先的序列,在SARS-CoV-2跃入其人类宿主的时期就支持了这一点。由于广泛传播,该病毒在几个国家的遗传多样性概括了其全球遗传多样性的很大一部分。我们确定了SARS-CoV-2基因组的区域迄今仍然基本不变,而其他区域已经积累了多样性。
通过关注已经独立多次出现的突变(同源性),我们确定了SARS-CoV-2基因组中的198个过滤后的复发突变。将近80%的复发突变在蛋白质水平上产生了非同义的变化,表明可能持续进行SARS-CoV-2的适应。
来自病原体的基因序列数据分析日益被认为是传染病流行病学的重要工具。遗传序列数据揭示了关键的流行病学参数,例如爆发/流行的时间加倍,传播途径的重建以及可能来源和动物库的识别。此外,全基因组序列数据可以为药物和疫苗设计提供依据。确实,基因组数据可用于鉴定与宿主相互作用的病原体基因,并能够表征病原体基因组的更多进化受限区域,应优先针对这些区域,以避免快速的药物和疫苗逃逸突变体。
结论一:随着时间的流逝,SARS-CoV-2基因组多样性的出现
7666个 SARS-CoV-2基因组为COVID-19大流行提供了出色的地理和时间覆盖范围。基因组的基因组多样性表现为径向和线性布局中的最大似然系统发育。数据中有一个强大的时间信号,可以通过7666 SARS-CoV-2的采样日期与“根到尖端”距离之间的统计显着相关性来捕获。预期在收集遗传数据的时间范围内存在可测量的进化时,采样时间与进化之间的这种正相关。具体而言,自最近分离的菌株与最新的共同祖先不同以来,它们在基因组中的积累的突变量就超过了旧菌株。
结论二:无处不在(Everything is everywhere)
最大似然系统发育中的一些主要进化枝主要由从同一大陆采样的菌株形成。但是,这可能表示时间信号而不是地理信号。的确,最早的可用菌株是在亚洲收集的,COVID-19大流行始于亚洲,随后首先在欧洲,然后在美国进行了广泛的基因组测序工作。
在大多数国家(具有足够的序列)中发现的SARS-CoV-2基因组多样性从本质上概括了7666个基因组数据集中COVID-19的全球多样性。下图突出显示了在英国、美国、冰岛和中国发现的全球遗传多样性的比例。在英国、美国和冰岛,SARS-CoV-2的全球大多数遗传多样性得到了概括,每个国家都有所有主要进化枝的代表。对于其他国家,例如澳大利亚,也是如此。
在不同国家流通的SARS-CoV-2种群的这种遗传多样性表明,这些地方流行病中的每一个都是通过大量独立引入该病毒而播种的。但是,这个全球数据集仅包含来自意大利的35个SARS-CoV-2基因组,因此流通中SARS-CoV-2菌株的某些遗传多样性可能仍未抽样。
在多个国家概述的全球SARS-CoV-2人口的基因组多样性表明,COVID-19可能在全球范围内从大流行的早期开始广泛传播。
结论三:基因组比对和反复突变的遗传多样性
在整个比对中,遗传多样性存在差异,多态性经常出现在邻近的簇中。然而,由于缺乏随附的序列读取数据,并非所有这些位点都可以被确认为真正的变异位置。但是,我们仔细检查了在最大简约树构建步骤之后似乎多次出现的那些站点。我们鉴定出大量推定的同质性,将其过滤为198个位置的高置信度队列。
讨论
大流行已经影响人类数千年了。仅在上个世纪,全球数种流行病已经夺走了数百万人的生命,包括1957/58年的甲型H2N2流感大流行,第六次(1899–1923年)和第七次“埃尔托”霍乱大流行(1961-1975年)。就像1981年至今的艾滋病毒/艾滋病大流行一样。COVID-19不受欢迎地提醒人们,传染病在死亡和破坏方面构成了主要威胁。
与以前的大流行相比,当前形势的一个积极方面是面对新冠肺炎的科学技术手段空前的可用性。特别是药物和疫苗的快速发展已经开始。现代药物和疫苗的开发主要基于基因工程和分子水平上对宿主-病原体相互作用的理解。世界各地的科学家动员起来应对COVID-19大流行是非常了不起的。这包括全球科学界的壮举,在撰写本文时(2020年4月23日),该壮举已经产生并公开分享了超过11,000个完整的SARS-CoV-2基因组序列。
这种空前的基因组资源已经为大流行提供了强有力的结论。例如,由多个独立小组进行的分析将COVID-19大流行的起点定在2019年底。这排除了任何假定SARS-CoV-2可能早在被识别之前就已经流通并因此已经感染了很大一部分人口的情况。
迄今为止,在人类传播的SARS-CoV-2中观察到的绝大多数突变可能是中性的,甚至是有害的。同质性,例如我们在此处检测到的同质性,可能是中性进化的产物或正在进行的选择的结果。在我们检测到的198个同质异体中,很可能是真正选择的真正目。
本期编辑 南瓜
本文首发于微信公众号:21世纪经济报道。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
最新评论