震惊!英国科学家研究得出,欧洲人祖先真的起源于中国

当今非非洲人Y染色体的东南亚起源

克里斯·泰勒·史密斯教授等,英国桑格研究所

一、摘要

当今非洲以外人类的基因组几乎完全起源于大约50,000至70,000年前的一次外迁,其次是与尼安德特人(注:西方认为是一种在大约12万到3万年前冰河时期本来居住在欧洲及西亚的人种,尼安德特人的遗迹最早是1856年在德国的尼安德谷所发现)的混合,约占所有非非洲人的2%。但是,由于在这个关键时期没有可用的古代DNA分析方法,因此对于这种初始迁移的细节仍然知之甚少,并且由于随后的种群移动或重塑,当前常染色体数据的解释也很复杂。但是,一个基因座确实保留了这个早期阶段的雄性特异性信息:Y染色体,在该染色体上已构建了详细的经过校准的系统发育史。

最初的迁徙携带了三个当今的Y血统:稀有的单倍群D、中度稀疏的C和非常普遍的FT血统,现在这些血统占据了大多数非非洲人口。在这里,我们显示了单倍群C、D和FT序列的系统发育分析,包括非常罕见的深根谱系,以及对古代和当今非非洲Y染色体的系统地理学分析(可知),在50,000至55,000年前,所有已知存活的非非洲男性血统(最近的移民除外),均指向东亚或东南亚。该观察结果与通过从非洲附近的地区扩展的简单扩展模型所预测的西欧亚起源的预期形成对比,并且可以解释为,源自初始种群的广泛遗传漂移或从东部取代了早期西方Y谱系。

前言:

一种共识认为,非洲以外的现代人类的基因组几乎完全起源于大约5万至7万年前的一次大规模迁移,与尼安德特人的混合,占所有非非洲人基因组的2%。该混合事件的可靠日期来自尼安德特人时期到公元前7000-13000年。这一时期是乌斯特伊希姆人生活的时间(45000年前)。因此,尼安德特人的混合应该发生在52000年和58000年前,而离开非洲的迁徙一定发生这混合之前。然后,混合种群在欧亚大陆和澳大利亚的大部分地区迅速扩张。结果,人类在5万年前就出现在这片广袤的土地上。然而,关于最初扩张的细节仍不甚清楚。它是沿着沿海路线,内陆路线,还是多条路线?现代人类的祖先是在何时何地开始分化的?今天的人类在多大程度上保留了这些早期模式的遗传印记?利用5万到7万年前的样本进行的古代DNA研究可能会为这些问题提供明确的答案,但由于缺乏合适的样本,迄今为止还没有报道。

当今人群的全基因组分析,显示出随着从非洲旅行距离的增加,遗传变异稳步减少,并已被解释为预测这种下降的“串行创始人”模型来解释。虽然这种模式最初可能是通过这种方式建立的,但后来的运动和混合事件的复杂性越来越多地被近代以来的古代DNA所记录,任何早期的人口结构模式都不太可能持续5万年,因此,由于随后的史前史的复杂性,(使得)对目前的常染色体基因组到最初的非洲外扩张的见解感到困惑,尚无合适的aDNA(支持),并且(还)需要其他信息来源(作为证据)。

尽管如此,串行创建者模型提供了一个标准模型,可以与其他模型进行比较。然而,基因组中有一个区域有可能以一种独特的方式告知这些事件:Y染色体。这是因为它的雄性特异性部分提供了单倍型,据此可以创建详细的校准系统发育树。几棵这样的树是独立建造的,并且在从50,000个到60,000年前的关键间隔中,从一个单一的单倍体组(称为CT)开始,一直以非非洲Y谱系的大规模扩张为主导(单倍体名称见图1)。考虑到罕见的非洲D0血统和上面概述的时间表,我们认为,CT内的最初分化很可能发生在迁徙前的非洲,其产生的三个血统C、D和FT是由当今非非洲人的祖先所带有的。随后,这三个谱系分别进行了扩展:C和D适度扩展,而FT则大量扩展。因此,我们着手重新检查这三个血统中的早期分歧,以研究他们在此早期阶段对男性历史甚至人类历史可以提供的见解。

(图1)

二、结果与讨论

我们从全球调查中收集了可用的C、D和FT谱系序列,以确保代表了常见的谱系,并用可能与早期分歧相关的已知稀有谱系补充序列,特别是澳大利亚C、安达曼语D和来自中国、越南和新加坡的F染色体共1204个序列。然后,我们重点讨论了这三个谱系早期分歧的系统发育结构,以及它们的地理分布所揭示的古代DNA和现代分析。

产生的Y染色体树(图1)描绘了50个谱系,其中非洲谱系(金)仅由四个主要的非洲单倍体代表,而没有其后继分支,但非非洲谱系则更充分地代表包括所有这些都起源于45,000年前,并且在当前Y染色体样本以及一些较丰富的近期谱系当中发现。正如以前的分析所预期的那样,该系统发育史表明,三个初始谱系C、D和FT分别在54,000年后很快经历了初始快速扩增, C内有7个分支机构,D内有5个分支机构,FT内有18个分支机构(总共30个非非洲血统);到45,000年前,FT的分支机构数量已增加到24个(总共36个)。这些分支模式,以及来自2319个序列分析的血统现今位置,为早期扩张的可能位置提供了见解。世系C分为C1和C2两部分;今天,C1谱系仅在东亚、东南亚和南亚以及大洋洲中发现,而C2谱系则更普遍,现在在东亚和南亚以及北亚和中亚/西亚也有发现(图2,补充图1)。

(图2)

D谱系完全局限于东亚和东南亚。FT谱系现在在世界范围内分布,但最早分裂为F和GHIJK;F只在东亚和东南亚发现(图1,补充图1),而GHIJK及其后代在世界各地都有发现。这些后代谱系本身通常具有更多的特定于大陆的分布,但是起源于50,000年前之前的14/15 GHIJK谱系的分布范围包括东亚,东南亚或南亚。很少有大洋洲特有的(图1)。只有一种(H2,代表单一样本)是欧洲特有的,没有一种是与非洲可能的出口路线相邻的地区特有的,目前在所检查的样本中不到一半。

没有早于45,000年前的远古y染色体数据被报道,但是有21个生活在30,000 - 45,000年前的亚洲或欧洲男性被记录在案,其中18个被报道为C、D或FT,十个属于C谱系,六个来自北亚,四个来自欧洲。其余8人属于FT,3人来自北亚,1人来自东亚,4人来自欧洲。尽管数据有限,但可以得出两个结论。首先,在5万年前的图1所示的30个样本中,没有一个样本携带Y血统。第二,C谱系(包括C1a和C1b)现在局限于东亚、东南亚、南亚和大洋洲,在3万到4万年前更为广泛,包括在欧洲,它们一直持续到8000年前,尽管它们现在在欧洲已被其他谱系取代。

在一个简单的(西方的人类非洲起源)模型中,人类是从非洲逐渐扩张到亚洲和大洋洲的,却没有随后的大陆尺度的重塑,我们可以预期(假设?)y染色体系统发育的最初分歧应该发生在靠近非洲的地理位置,今天的Y染色体系统地理学也应该反映这一预期,也就是应该显示早期分化的谱系C、D和FT的存在地区是在中东/西亚(图3a),而在更远的东方,谱系多样性应该较低。但与这预期形成鲜明对比的是,现实观察到的这些谱系分布都位于更靠东亚的地方,这表明这种简单的模型无法解释目前观察到的数据(图3b,补充图3),这种差异我们将在下面进一步讨论。

(图3)

像Y染色体一样,母系遗传的线粒体DNA(mtDNA)的系统发育也保留了50,000至70,000年前的信息,尽管它是女性特有的,但由于其长度较短,因此信息较少。然而,它提供了一个有用的比较。在非洲以外,从古代和现代序列的组合推断,最初的分裂是在M和前N谱系之间,M谱系分化可追溯到44000 ~ 55000年前,N谱系分化可追溯到47000 ~ 55000年前。当今mtDNA的地理分布不如Y染色体具体,而且这两个主要谱系在世界范围内都已广泛传播,尽管当今的欧洲人除了最近的迁徙外都没有M。尽管如此,M至少在28,000年前就存在于欧洲早期的人中。此外,前N / N谱系中的第一个分支介于罗马尼亚Oase1携带的距今40,000年前的N-mtDNA之前(顺便说一句,尼安德特人的混合物增加了)和世界范围内的其余N-mtDNA。因此,mtDNA与Y染色体具有大陆尺度变化的历史(来自欧洲的M丢失),mtDNA的情况可以追溯到28000年前之后。N-mtDNA表现出简单扩展模型所期望的系统地理格局,其分化最早出现在西方。那么,如何将当今的Y染色体系统谱与非洲以外的扩张相协调?

众所周知,当今所有已知的Y染色体谱系都可以追溯到人类历史上的非洲,但是当前的研究表明,最深的生根的C,D和FT谱系现在在非洲以外看到的是在东亚/东南亚。如果没有其他古代DNA样本的支持,就很难对这些根深蒂固的血统的地理起源做出断言。但是,此困难不会改变对它们当前位置的观察。对于观察到的模式的默认解释可能是,Y染色体进化树内的初始差异确实发生在西方,但是如今最深的生根谱系已经从世界的这一部分消失了。西欧亚大陆的基因连续性见常染色体aDNA以及西欧亚大陆中存在Y 单倍型C谱系直到8000年前。原则上,这可能是因为C、D、F系全部向东迁移,连同一些GHIJK系,只在西方留下GHIJK系;或者更合理的解释是,C、D和F基因在西方因遗传漂变而丢失,而在东方却没有。第一种情况将意味着男性结构性移民的空前水平,并且将难以与以后几千年来GHIJK内部随后的分歧相协调,因此,G1,H1和H3等后代世系也需要已经以男性结构向东方迁移。第二种情况不容易用简单的方法来确定,因为东亚地区的遗传有效群体规模低于欧洲,因此西方的遗传漂移预计会减少。

因此,还应考虑进一步的解释;一个这样的例子是,最初的西方Y染色体已经完全被来自更东部的世系所取代(图3),也许是在不止一次的情况下。如今位于东亚和东南亚的C,D和FT早期分化谱系的观察模式证实了这一点,并且根据我们目前尚存的谱系数据集,东部GHIJK的可能性更大(图1)。从形式上讲,另一个解释可能是选择的作用,例如在不同区域以不同程度支持FT谱系,但人类Y染色体上尚未见到阳性的自然选择,并且有在带注释的蛋白质编码基因中没有报道候选编码变体,因此这似乎不太可能。然而,目前对于所观测到的Y单倍型分布现象的各种解释都暂时无法被辨别真伪。直到可以获取早于45,000年前的aDNA数据为止,未来使用空间模拟和能够充分捕捉人类过去复杂性的模型进行的研究都可能有助于解释当今人类Y染色体数据中观察到的模式。

古代DNA研究开始显示人类遗传历史某些真正的复杂性,包括为近30,000年左右的大规模洲际运动提供证据。非洲以外的模式要求40,000至60,000年前的主要洲际运动,以及后来向美洲的扩展。从这些角度看,大规模的运动在整个人类史前时期可能继续存在的可能性更大,因此从东方进行的替代是要考虑解释的。最终,这一时期的史前历史必须包括化石、考古和多种形式的遗传数据,并将它们调和成一个连贯的整体理解。Y染色体独特的遗传特性可以让我们对早期运动有更深入的了解,这是目前很难用其他方法来研究的,也可以让我们对这个史前时代有一个大致的了解。


(0)

相关推荐