8/18/2020

从基因科学的角度来看,家谱的准确性究竟有多高?

家谱作为民间记录的重要载体,寄托着团结宗族、教导后人的家族精神,是中华传统文化的重要组成部分。

timg.gif

但是回归到科学的角度,家谱记载的名人祖先、事迹是否可靠呢?

由于明清时期中国修谱风气炽盛,穿凿附会成为一种普遍行为,现存家谱基本都是编撰于这一时期,令家谱记载的真实性大打折扣。

所以辨别家谱记载的真伪是每位谱学爱好者必须要面对的一个问题。仓修良先生在《谱牒学通论》一书中明确指出家谱具有多方面的价值,但胡编乱造、毫无价值的家谱也有不少,千万不要过分夸大家谱的文献价值,应当本着实事求是的态度对待家谱。

下面我们就从基因科学的角度来探讨一下家谱的准确性问题。

由于家谱是与姓氏挂钩的,而姓氏的父系继承特性与男性的 Y 染色体遗传逻辑是一致的,所以我们不妨将两者结合起来,从两方面来分析家谱的真实性:

A. 同一个祖先,后代保持原来姓氏的概率有多大?比例几何?

B. 同一个姓氏,都是同一个祖先的概率有多大?比例几何?

一、同祖不同姓的概率/比例

首先,每位男性的父系祖先都是可以通过 Y 染色体单倍群追溯的。所谓 Y 染色体单倍群,是根据 Y 染色体上一些稳定突变构建的全球男性谱系树,例如,全球男性都是 20 多万年前一位智人的后代,而中国 77% 的男性(O 系)都是 3 万年前一位男性的后代。也就是说,这个谱系树会根据 Y 染色体上的突变位点不断往下分,即形成一个个越来越晚近的支系,所有该支系的人都有共同的祖先。

据此,我们可以分析一些年龄不到 2500 年(姓氏已经产生的时间段内)的 Y 染色体支系,结合用户的姓氏资料,统计千年过后能保留原姓的比例有多高。

我们挑选了秦汉以来人口最多的 13 个家族,分析出了他们的首位姓氏占比:

秦汉以来人口前13 家族.png举例分析,目前中国人口最多的家族——「O-F155 刘邦家族」,这支年龄 2300 左右的支系,在中国男性中占 1.91%,推测为刘邦的后代(具体家族分析过程可见23魔方官网「基因家族」一栏)。

该支系中占比最高的是刘姓,达 22.2%;占比第二的是王姓,占 7.2%。如果确定是刘邦后代,那么 2300 年过去了,保留原姓的比例是 22.2%。如果是王姓(可能性不大),那么保留原姓的只有 7.2% 或更低了。

同样,排名第二位的是「O-CTS6987 东南林氏家族」。该支系的祖先大致为 2130 年前一位男性,属于福建人的超级簇,在闽方言区中占 10% 以上。

该支系最大的姓氏是林氏,占 22%,也就是说剩下的 78% 的人口可能都改了姓。(以上「人口」均只含男性)

据此可以看出,同祖不同姓的概率非常大。

二、同姓不同祖的概率

我们放两个不大不小的姓氏来看吧。数据皆来自于23魔方数据库。

先看「汪姓」的 Y 染色体构成。民间俗说「九李十八张,天下无二汪」,事实真的如此吗?

其实不然,实际上汪姓的内部分支相当复杂,仅选取 26 例样本就测出了 20 多种类型。 汪.jpg再看看全国排名第 49 大姓的「沈姓」。按袁义达《中国四百大姓》记载,沈姓有几个主要来源:嬴姓、姒姓、芈姓、姬姓、王姓所改、少数民族所改。但是抽取23魔方数据库发现,仅选取 43 个人就测出近 30 种类型。

下图列出的沈姓支系很多是年龄大于 5000 年的。什么概念呢?即在 5000 年前中国姓氏、文字还没出现的时候,这些人就分家了,所以根本不可能是从同一姓氏源头传下来的。 沈.jpg综上我们可以看出,中国人改姓的频率远远超出想象。从父系与姓氏的对应看,1000 年下来,改姓比例可达 60% 甚至更高。因此,今天我们大部分人的姓氏其实都更是改过。

为什么姓氏内部如此复杂,改姓率如此高?主要是由于几千年的时间跨度中,由于战乱、过继、抱养等情况,有大量人口主动或被动改姓。哪怕是离我们最近的朱明皇室、爱新觉罗皇室,也在朝代变换后大量改姓,时间一长,改姓的那段历史就被后人遗忘了。

这些改姓的记录在大多数家谱里是不会有的,而家谱一般只会把祖先追溯到自己当前姓氏的某个古代名人。同时,宋元时期除了欧阳修、苏洵所修两种家谱外,尚未发现有其他家谱流传下来,那么以 1000 年为界,宋代以前的世系基本都不可靠。

如果家谱告诉你:你姓刘,是刘邦后代;你姓王,是琅琊王氏或太原王氏;你姓李,是陇西李氏;你姓林,是比干之后;你姓崔,是清河崔氏或博陵崔氏等等,当看到诸如此类记载时,首先自己心里就要先打个问号了。