12/9/2020

从9000年到2000年,不同年龄的父系单倍群分布上有多少差别?

根据以往的观察,我们发现一个趋势:共祖越晚的父系单倍群分布上也越集中。

这个不难理解。极端的情况,如五代以内的同宗,亦可称之为一个家族,这种共祖年龄只有 100 多年的父系多数集中在一个村(近几十年的城市化正打破局面)。而年龄比较早的父系类型,譬如 3 万多年的 O 系,中国各省频率相差不大。

基于此,我们不妨统计一下不同年龄段的父系单倍群的分布差异。

这里提出一个「优势省份」的指标:扣除户籍人口不足 2000 万人的省市自治区,剩下 25 个省市自治区;取某支系的各省频率的前三位的平均值作为该支系的「中心频率」;达到「中心频率」的 30% 的省份即为 30% 优势省,达到「中心频率」的 60% 的省份即为 60% 优势省。

单倍群筛选:并非所有支系都适合于比较。只选择在某个年龄段有明显分化的单倍群作为这一时期的代表。如 O-F8,在 7000-6500 年前分出多支,可作为 7000 级父系的代表。此外,还需考虑个别下游的对上游整体分布的「干扰」:若某个支系(代号: A)年龄 3000 年,而它的一个 2000 年的下游分支(代号:B)占了该支系人口一半以上,则这个支系 A 是不适合作为 3000 年级别的支系进行统计的,因为它的 2000 年下游 B 很大程度上主导了 A 的分布。

统计结果如下:

閰嶅浘.png