「魔方祖源」App,随时随地查找家族资料

扫码打开「魔方祖源」App

修复并补充数学方法,兼论楚武王与O-FGC19707的关系

回顾一下贝叶斯公式:推广到含有多个制约性后验事件的情况,则有:若这些“事后诸葛亮”的条件互无关联(即A只与B有因果关系,不同的A之间没有因果关系),则有:将该公式命名为广义贝叶斯公式,记求积号后面的部分为贝叶斯因子,则后验概率为没有条件时的后验概率(P(B))乘上所有制约事件的贝叶斯因子。只是贝叶斯因子本身也有P(B)的成分:
其中
P(B)指排除制约条件的初始概率。
    对于楚武王与O-FGC19707的问题,直接使用广义贝叶斯公式显然过于复杂,因为除了O-FGC19707的树形和共祖时间,姓氏、地理位置、家谱、古DNA等信息一概不知,这个初始概率怎么估算?为此,将广义贝叶斯公式做一个等价变形。
    变形结果与传统贝叶斯公式对应。这样我们可以将一些姓氏分布、地理位置等原始宏观信息进行打包,并得出三支候选O-FGC19707,O-F793,O-Y20932,用微观信息(比如传说中的某只楚王后裔测出了哪支父系基因)所对应的贝叶斯因子逐一修正概率。下面用邵阳屈的信息举例。
    邵阳屈有明确的家族记忆是屈原后裔(过于久远的家族记忆显然要存疑),而且测出19707,屈原又是楚武王后裔。我们不妨对前者保留质疑,方便起见对后者进行默认,相当于忽略小量。再次摆出贝叶斯因子:
    即A为“邵阳屈呈现19707”,B为“楚武王为19707”,则分母中的四个概率,从左到右分别为“在楚武王为19707的前提下,邵阳屈为19707的概率”“楚武王为19707的概率”“在楚武王不为19707的前提下,邵阳屈为19707的概率”“楚武王不为19707的概率”。第三个概率最好算,因为屈姓在全国的占比0.05%,屈姓在楚王候选三支中的富集度又很低,所以此概率约为0.05%;先秦改姓率很高,按照90%计,忽略小量,第一个概率约为10%乘上“邵阳屈为屈原后裔”的概率。屈原后裔太少了,全国人口基数太大了,所以尽管全国人口中冒领屈原的比例很小,最终的结果也是冒领的概率极高。魔方推断大族准确率高于50%,考虑到楚王后裔应在河南省富集这一点魔方没考虑到,并且魔方推断两支父系19707和793的交界点未知,“楚武王为19707”的概率按20%计。但是根据邵阳屈大概率是冒领,最后的结果就是啥也算不出来。
    跳脱楚王问题,重新回到纯数学分析,若P(B)和P(非B)在同一量级,P(A|B)远大于P(A|非B)(前者未必本身就大,只要在乘法层面上远远太于后者就行,不是加法和对数),在以一点精确度为代价的前提下舍弃后一项,则贝叶斯因子约为1/P(B),推算出来的概率约为100%。在贝叶斯因子一重又一重的累乘中,虽然整体满足交换律,但P(B)的变化是明显的,那么贝叶斯因子和后验概率特征值f(P)的增量(以下简称后验概率增量)很难与事件直接相关。所以在精确的计算中,我之前提出的后验概率增量(△lnP)概念完全没有必要,可以大大方方地舍弃。
    那么有什么方法让信息和概率变化直接联系起来?有什么方法把魔方定性推断量化?欢迎大家补充。
4 条评论
热门最新

祝融OM188

结论就是:邵阳屈是O-FGC19707不能作为楚武王是19707的论据

添加评论

1

祝融OM188

添加评论

点赞

祝融OM188

1 评论

点赞

  • 粉嫩

    03-22
    你不是C系吗

    点赞