12/22/2020

中国人的父系到底有多少种?

中国人的父系有多少种?这是一个笼统的问题。 我们通常说的父系分类,是以特定的共祖年龄为条件的。

如以 7 万年(即共祖小于 7 万年的算作一种父系),则中国人几乎都属于 CT 这个支系。若以 5 万年为上限,则中国人也几乎都属于 F、C、D 这三种支系。

但是,我们测祖源显然不是只测到 F、C、D 就满足了,这和宣告自己是中国人或东亚人有什么区别?因此就有了不断往下分类的必要。

1. 以 16500 为上限,中国的父系分类

23魔方 app 的「基因寻宗」提供了查看共祖年龄在 16500 的同支样本的功能。这样的分类源自于中国 Y 染色体谱系树习惯上的分法,也可以将分布较为相似的支系如 O-Page59(16000 年)、O-AM01822(15500 年)等设置为一个支系。

此种分类下中国人的父系主要有:

 图片1.png

上述统计对象为东亚人的父系,即新石器时代可能已主体或有较多人口生活在中国境内的支系,总计接近 40 种。

2. 以 7300 为上限,中国的父系分类

为什么不以 7000 年,而是 7300 年?因为 7000 年只是对于当前来说是一个整数,但历史意义却不明显。而 7300 年 BP( Before Present )这个节点更有意义,很多支系在此之后有了明显的分化,如 O-F8、O-SK1768、C-F10056 等。

23魔方目前已经发现的分开 7300 年的东亚人父系接近 300 种,为分开超过 16500年 的支系的数量的 7 倍左右。

3. 以 3100 为上限,中国的父系分类

23魔方 Y 染色体全序树上现有的东亚人支系中,分开 3100 年(西周初年以来)以上的分支及末端(单样本)接近 3000 种。据此估计,东亚人中分开 3100 年以上的不同支系可能接近 4000 种。

这里有人可能会有疑问:是否还存在数量是已知支系好几倍的「超级芝麻型支系」等待去发现呢?

实际上,从人口发展模型来看,支系只有达到一定规模才能保证传承的稳定性,规模太小的支系漂变效应过强,极其容易被洗刷掉,此类支系绝大多数已经消失在历史长河里了。

4. 支系规模的天壤之别

据上述推断,中国的 3100 以内的父系可能多达数千种,但支系规模却呈天壤之别,人口规模较大(如:占中国男性 0.2% 以上)之的支系只是少数,但这些少数支系加起来的总比例又可以覆盖到较多的人口。

以 O-F8 为例,分开超过 3100 年的众多支系中,前六个人口最多的支系加起来即可占中国男性的 5.51%,占 O-F8 男性的 35% 左右。如下所示:

 图片2.png

若统计分开 2300 年的所有支系,前十大支系亦能占 O-F8 的 26.4% 左右。

因此,纵然支系种类很多,但由于少部分支系即可覆盖较多的人口,23魔方现有的 Y 全序树是能够让大部分检测者匹配到 2300 年内(秦汉及以后)的同宗的。当然,随着检测的人越来越多,匹配到晚近同宗的可能性也就越来越大。