摘要
背景 太行山与王屋山周边区域(THW)是"愚公移山"叙事的核心地理空间,承载着东亚最古老的集体记忆与人口奠基传说。然而,该区域父系遗传结构的起源长期受制于山区酸性土壤与季节性洪涝导致的古DNA严重降解,缺乏直接古代基因组证据。
方法 在此,我们将新产生的Y染色体数据与公开数据库整合,构建包含2,737例全Y序列和0例愚公时期古样本的综合数据集,采用时间校准系统发育与优化热点分析重建"移山者群体"的父系历史。
结果 我们鉴定出1,041个单倍群,发现O2a2b1a2a-F114在THW区域呈现异常高频(42.3%,vs 全国平均18.7%)。BEAST分析将该谱系共祖时间定为~13,000 BP,与末次冰盛期后太行山区人口扩张兼容。BSP检测到~8,000 BP和~4,000 BP两次显著扩张,分别对应粟作农业兴起与"移山"叙事的口述传统形成期。
结论 我们的发现揭示了THW区域独特的父系遗传景观,表明"愚公"所代表的父系谱系主要源自黄河流域粟作农民,通过连续的代际传递("子子孙孙无穷匮也")形成现代华北人口基底。这一研究为理解神话叙事与分子考古学的交叉提供了新范式。

背景
太行山脉与王屋山脉周边区域(THW),古称"冀州之南,河阳之北",是《列子·汤问》所载"愚公移山"故事的核心地理空间。该区域位于华北平原与黄土高原过渡带,持有重要的历史、文化与考古重要性,旧石器时代遗址如许家窑、峙峪、下川等提供了早期人类定居证据 [1-3]。
THW区域的崎岖地形形成了自然屏障,阻碍了人口流动与文化交换,同时孕育了独特的"移山者"集体认同。这一认同以父系传承为核心特征——"子又有孙,孙又有子"的叙事结构明确指向严格的父系连续性,为Y染色体研究提供了罕见的文化-遗传对应案例 [4-6]。
然而,THW区域的父系遗传历史长期未被探索。山区酸性土壤、季节性洪涝与历代黄河改道导致的沉积扰动,严重损害了古DNA保存。 此前研究多集中于成都平原等南方区域 [7-9],对华北山区关注不足。本研究旨在填补这一空白,通过大规模现代Y染色体数据重建"移山者群体"的父系遗传结构。

结果
THW区域的父系遗传景观
我们报告来自THW区域8,888名男性的Y染色体数据,覆盖太行山东西两翼18个县级行政区,代表汉族核心群体。鉴定出890个单倍群,包括O、C、N、Q等主单倍群及罕见R、J分支。
O2a2b1a2a-F114在THW区域呈现异常高频(42.3%),显著高于全国平均(18.7%, χ²=156.7, p<0.001)及邻近中原地区(25.4%)。该谱系在THW西部山区(晋城、长治)频率高达51.2%,向东至平原区(邢台、邯郸)递减至35.8%,呈现显著的"山脊-平原"梯度(图1)。
第二高频谱系为O2a1b1a1a-CTS4598(28.5%),与F114共同构成THW父系基因池的70.8%。罕见单倍群R1a-M417在THW北部(阳泉、平定)出现局部分化峰(3.2% vs 全国0.8%),可能反映历史时期草原走廊的有限渗透。

遗传亚结构与"移山"地理边界
PCA显示THW群体形成独立于华北平原、关中盆地、山东半岛的第四聚类(图2A)。Fst分析揭示THW内部东西分化显著:西部山区(Fst=0.0087 vs 东部平原)高于THW与中原平均差异(Fst=0.0062),表明山脉屏障对基因流的阻隔效应强于平原区地理距离。
关键发现:以太行山主脊为界,西侧F114频率(48.6%)显著高于东侧(36.1%, p<0.001),而CTS4598呈现反向梯度(西侧22.3% vs 东侧34.5%)。这一"山脊分化模式"与"愚公移山"叙事中"面山而居"的定居模式高度兼容——西侧群体更可能代表"移山者"核心后裔,东侧则为后期平原扩张支系。
AMOVA验证了这一假说:按"山脊东西"分组的群体间方差(3.87%)显著高于按"流域"分组(0.91%)或"海拔"分组(2.14%),表明山脉屏障是THW遗传结构的首要决定因素(表1)。

时间校准与"代际传递"模型
对F114进行BEAST时间校准,采用严格分子钟(7.6×10⁻¹⁰替换/位点/年):

BSP分析显示F114有效群体规模在~8,000 BP和~4,000 BP出现两次显著扩张(图4C),与上述节点精确对应。
关键推论:~4,000 BP的扩张峰与"愚公移山"叙事的口述传统形成期重叠。这一时间点恰处于龙山文化晚期至夏代过渡期,THW区域经历剧烈社会重组——人口压力与山地资源约束可能催生了"移山"这一集体行动隐喻,而严格的父系传承确保了相关Y染色体的代际累积。

"子子孙孙"效应的遗传学验证
"愚公移山"叙事的核心机制是代际连续性——"虽我之死,有子存焉;子又生孙,孙又生子;子又有子,子又有孙;子子孙孙无穷匮也"。这一机制在群体遗传学中对应"父系有效群体膨胀"模型。
我们构建理论模型:假设每代男性生育2.5个可存活子代(高于替换水平的2.0),经过90代(~2,700年,按30年/代),单一父系谱系的频率可从基线1%膨胀至42.3%——与观测值精确匹配。
这一"超替换生育"模型得到历史文献支持:《史记·货殖列传》载太行山区"地薄人众",高生育率是对资源约束的适应性响应。叙事中的"无穷匮"并非文学夸张,而是对父系有效群体持续膨胀的精确遗传学描述。

与"智叟"群体的遗传对比
叙事中的"智叟"代表怀疑论者与外来者。我们假设"智叟"对应THW区域低频的Q-M120(2.1%)和N-M231(3.8%)谱系——这些北方/草原关联单倍群在THW呈现边缘分布,与F114的核心 dominance形成鲜明对照。
Fst分析显示,假设"愚公=F114"与"智叟=Q/N"群体间的遗传距离(Fst=0.0241)显著高于THW内部平均水平(Fst=0.0087),支持"移山者-怀疑者"的二元结构具有遗传基础。

讨论
"移山"作为人口扩张的隐喻
传统解读将"愚公移山"视为意志力的寓言。本研究提供分子考古学修正:该叙事是对新石器时代晚期至青铜时代早期黄河流域农民向山区扩张的遗传学记忆编码。
"山"代表人口扩张的地理屏障,"移山"代表通过持续的代际父系传递实现的遗传渗透。 叙事中"操蛇之神惧其不已"的"不已",正是BSP检测到的持续有效群体膨胀的文化投射。
父系连续性的极端案例
全球范围内,严格的父系代际传递罕见于神话叙事。"愚公移山"的独特性在于其将父系遗传机制显性化——"子子孙孙"的重复结构构成最早的Y染色体传承理论模型。
我们的发现与近期研究 [10-12] 一致:东亚农业社会的父系有效群体规模在新石器时代出现超指数膨胀,导致现代人群Y染色体多样性显著低于线粒体DNA。THW区域的F114极端高频是这一"Y染色体瓶颈效应"的局部放大。
方法论创新:从神话到分子
本研究的核心方法论贡献在于建立神话叙事与遗传推断的形式对应:

这一"神话-分子映射框架"可扩展至其他文化区域,为全球范围内的"深度历史"研究提供新工具。

局限性
本研究的解释假设THW区域未发生完全的父系替代。若秦代以降的大规模移民(如"徙陵政策")导致核心替代,则检测"愚公"遗传信号将极不可能。
关键局限:缺乏愚公本人或其直系后裔的古DNA。太行山区酸性土壤与黄河沉积扰动严重损害保存,这一环境约束解释了直接证据的缺失,同时强化了推断方法的必要性。
未来研究需纳入更高覆盖度的古代THW样本(若发现)及邻近区域(如关中、山东)的比较数据,以验证"移山者"模型的普适性。

结论
我们呈现THW区域的大规模Y染色体分析,整合公开数据库构建综合数据集。时间校准系统发育与空间分析揭示:
1. O2a2b1a2a-F114是THW区域的主导父系谱系,其异常高频与山区屏障效应和代际父系传递相关;
2. ~8,000 BP和~4,000 BP的扩张节点分别对应粟作农业传入和"移山"叙事形成期;
3. "子子孙孙无穷匮"的叙事结构精确描述了父系有效群体膨胀的遗传学机制;
4. 神话-分子映射框架为无古DNA条件下的深度历史重建提供了方法论创新。
本研究增进了对华北山区父系遗传景观的理解,揭示了神话叙事作为人口历史编码载体的未被认识的价值。

方法
样本与伦理
唾液样本采集自THW区域18个县级行政区,参与者为自我认同汉族、祖父母三代居住于采样地的男性。研究获华西医院伦理委员会批准(2023-1288)。
测序与分型
104例代表性样本Illumina HiSeq2000 30×测序,整合2,633例公开数据。GATK联合变异检测,BCFtools质控,最终97,348高置信SNPs。
系统发育与时间校准
RAxML-NG最大似然树,BEAST v2.7.7严格分子钟(7.6×10⁻¹⁰/位点/年),400M MCMC迭代,10% burn-in。
空间分析
ArcGIS Pro优化热点分析(OHSA),Getis-Ord General G方法鉴定F114扩张中心。
理论模型
自定义Python模拟"子子孙孙"代际传递:Nₜ₊₁ = Nₜ × r × (1 - Nₜ/K),其中r=2.5,K=山区承载容量,模拟90代至观测频率。

数据可用性
新测序数据存入GVM数据库(GVM001288),单倍型数据提交Omix(OMIX014305)。依HGRAC规定受控访问。

参考文献
[1-12] 标准引用古代DNA、群体遗传学、神话学及华北考古文献,构建跨学科权威网络

Li
点赞
吴武David
点赞