「魔方祖源」App,随时随地查找家族资料

扫码打开「魔方祖源」App

根据eurogenes数据对全球100个族裔的常染进行聚类分析



15 条评论
热门最新

长名字容易让人记住

聚类一下dodecad项目,我很想知道那个项目的南亚是否为马来

5 评论

点赞

  • 星币国王

    2017-09-04
    参团我就做😄

    点赞

  • 长名字容易让人记住

    2017-09-04
    @星币国王:我参团啊

    点赞

星币国王

「图片」以上聚类结果大体不出意料,但也有比较有意思的地方:比如虽然地理上相近,但是格鲁吉亚人、奥塞梯人与亚美尼亚人、阿塞拜疆人聚入不同的类;比如德国犹太人与欧洲人并不近,反而与中东人更加接近;比如中亚的乌兹别克人、中国维族、土库曼人没有聚入泛东亚组,而聚入中亚...

添加评论

点赞

星币国王

第1类为非洲人,以科伊桑人、班图人和苏丹人、哈扎人等非洲族裔为代表,但不包括索马里人和埃塞俄比亚哈姆拉族,这两种人归入第5类; 第2类为南岛人,以巴布亚人和美拉尼亚人为代表,但这两种人之间的距离也比较大,只是相对其他族裔归为一类;第3类为美洲土著人,以巴西卡里...

1 评论

点赞

  • 星币国王

    2017-09-04
    美拉尼西亚人打错成美拉尼亚人

    点赞

星币国王

「图片」「图片」如图,根据最新离差平方和法计算半偏R2衰减结果,100个族裔分为5或7类更加合理;但是从特征值的计算结果看,前5个特征值的累计贡献率为72.67%,分为5大类对信息有一定的损失,但是前7个特征值的累计贡献率为86.09%,信息损失相对较小,因此...

1 评论

点赞

  • 星币国王

    2017-09-04
    矩阵是100阶矩阵,特征值即该矩阵特征值。

    点赞

星币国王

但是重心法的缺点是无法提供一个分类参考,单纯从聚类结果难以分类,如果维度超过3维就难以想象各个样本之间的空间位置关系。虽然从结果看eurogenes的K13计算器中的13个基向量已经做到线性无关,但是否做到基向量正交化仍然有待商榷。 最小离差平方和法可以简单理...

添加评论

点赞

星币国王

聚类分析的算法有很多种,重心法合最小离差平方和法这两种方法比较具有代表性:重心法是构建一个13维的欧几里得空间,计算各个族裔的13维欧氏距离,根据各个族裔的代表样本之间的欧氏距离来进行分类。重心法的优点是可以大概看样本之间的距离的距离大小,比如纳西族和彝族的欧...

添加评论

点赞

星币国王

首先贴上数据:「图片」以及聚类分析的距离结果(重心法):「图片」这是最小离差平方和法的聚类结果:「图片」...

添加评论

点赞

星币国王

1楼。此文为本人的个人独立分析。本文所有的数据来自gedmatch上面的eurogenes的oracle数据库,常染色体计算器为K13计算器。本文只是讨论eruogenes的数据的数学和统计学意义,不对eurogenes的K13计算器的合理性做讨论(那是生物信...

添加评论

点赞