1.人类既然起源于非洲,为什么没有非洲血统?
人类走出非洲有7万年之久了,不同地区的人的基因因为自然选择、漂变等原因,基因组与非洲土著的共性方面已经有了差异,新的特性也会产生。民族成分分析的是现代人类基因组的差异,所以如果近代没有非洲来的祖先就不会有非洲血统。
2.祖源分析页面上的成分百分比是如何计算的?
23魔方祖源民族成分分析是基于人群多态性位点(SNP)来推测用户民族血统的。每个群体都有各自差异的群体特征单倍型,我们通过对用户的基因组和我们参考集合比较,找出最为匹配的祖源结构。因为常染的遗传存在着自由组合和重组,即使是亲生兄弟姐妹的祖源成分也存在着一定差异。
23魔方祖源分析算法是基于美国加州大学洛杉矶分校(UCLA)ADMIXTURE进行优化改良的一套自研算法,我们同时结合了机器学习SVM分类方法以及隐马可夫模型HMM平滑机制对祖源结果进行更精细化的分类和算法优化,力求提供最准确的符合我们该参考集合下的模型结果。
3.祖源分析的参考集都是哪儿来的?现在还有纯种的?
我们使用的祖源成分数据集都是现代人的数据,所以计算结果反映的是和目标群体在基因组层面的相似性,并不涉及群体起源层面的解释。样本选取地点如下:
中华民族
· 北方汉族样本取自中国北京
· 南方汉族样本取自中国广东
· 蒙古族样本取自中国内蒙古
· 通古斯族群(鄂伦春族、锡伯族、赫哲族等)样本取自中国黑龙江
· 傣族样本取自中国云南
· 藏族(藏族、纳西族和彝族)样本取自中国西藏
· 维吾尔族样本取自中国新疆
· 苗族样本取自中国贵州北纬
· 畲族样本取自中国福建
· 拉祜族样本取自中国云南
东北亚· 日本人样本取自日本
· 韩国人样本取自韩国
· 雅库特人样本取自俄罗斯
· 布里亚特人样本取自蒙古
东南亚
· 柬埔寨人样本取自柬埔寨
· 越南京族样本取自越南
南亚
· 巴基斯坦人样本取自巴基斯坦
· 印度人样本取自印度
· 以色列人样本取自巴勒斯坦
欧洲
· 阿迪格人样本取自阿迪格
· 英国人样本取自英国
· 法国人(巴斯克人)样本取自法国
· 芬兰人样本取自芬兰
· 西班牙人(伊比利亚人)样本取自西班牙
· 俄罗斯族样本取自匈牙利
· 撒丁岛人样本取自意大利
· 意大利人样本取自意大利
非洲
· 姆布蒂人样本取自刚果民主共和国
· 约鲁巴人样本取自尼日利亚
· 尼日利亚人样本取自尼日利亚
· 非裔加勒比人样本取自巴巴多斯
· 比亚卡人样本取自中非共和国
· 肯尼亚人样本取自肯尼亚
· 冈比亚人样本取自冈比亚
· 班图人样本取自南非
美洲
· 哥伦比亚人样本取自美国
· 印第安人样本取自墨西哥
· 玛雅人样本取自墨西哥
· 秘鲁人样本取自秘鲁
大洋洲
· 巴布亚人样本取自巴布亚新几内亚
4.为什么检测不出满族?
详见上述链接
5.韩国血统与朝鲜族能直接区分么?
目前我们的“韩国”血统使用的是“千人基因组计划”中韩国的样本,没有用到朝鲜族的样本,所以报告中显示的韩国血统就是韩国地区血统。中国东北以及中国的朝鲜族的部分人群与朝鲜半岛会有相似性,但是因为朝鲜族数据库人数较少,达不到选样标准所以还未对朝鲜族进行细化研究。
6.为什么混血的成分没有被检测出?
因为遗传过程中拥有随机性,并且我们检测位点并非均匀分布于所有染色体上,所以每一代的血统遗传给下一代并非严格的遵守50%的规律。一般来讲血统占比越高遗传给下一代的比例越稳定,占比越低就越容易出现某一部分血统完全遗传和完全消失的情况。所以拥有外国血统的祖先越久,后代遗传到他的血统在报告中显示的越低直至完全消失。
此外中国人的祖源与中亚、东亚以及东南亚会有共同成分,所以如果混血来源于周边国家很有可能在祖源分析时被归类到国内的一些类似的少数民族,比如东南亚血统跟国内的傣族更接近,中国东北地区人也会拥有韩国血统,韩国人也会拥有北方汉族、日本等血统。
7.为什么加入一家三口的数据后结果会发生变化?
民族血统比较功能模型是基于一家三口的数据进行计算的。当家系数据补全之后,模型会对家系数据重新进行Phasing(基因定向)确定其对应的单倍型,然后根据新的单倍型进行民族血统的运算,所以相对于单独的结果来讲,一家三口的数据会更接近真实情况。添加家系数据后结果自然也会发生变化。
8.为什么父母没有的血统孩子会有?
理论上,一般是不会出现这种情况。特殊情况是两参考集合非常接近导致模型区分能力降低。此外,在遗传重组之后,还是存在有这样一种可能,引入一些新的近似血统(小比例)。对此,我们的祖源成分分析结果会进行一轮基于家族数据的分析优化,但由于家系样品可能并不是同时检测,这样会存在报告优化的延时,有关的更新都会以日志形式在结果页尾说明。
财菜
点赞
景金铎
点赞