告诉大家一个好消息,23魔方1200万的扩展数据集已经可以开放下载了!!!!!!
扩展数据集是在原来70万芯片数据的基础上,通过Impute计算方法,扩展成整个基因组上的1200万个多态性位点的集合。各位基因数据发烧友可以从官网上下载原始数据集和扩展数据集。
有人会问,这东西有啥用?简单说,可以补充原有芯片数据的位点缺失的不足,能够提供更多丰富的项目分析内容,意义还是大大的。
此外,得到属于自己的扩展数据后可以在第三方解读平台如Promethease、GEDmatch等进行数据分析(注:有些第三方平台网站需要特殊通道登陆或者需要付费使用)。
这里以GEDmatch为例,简要说明如何使用原始/扩展数据集;
1. 数据下载
从23魔方官方网站中下载数据,登录账号,在个人中心里,可下载测序的70万位点数据以及1200万的扩充数据。当然,扩展数据集因为文件比较大分析需要时间,大家耐心等待,完成后会有系统通知。

2.GEDmatch使用方法

(2)成功登录网站后,在主页面右栏的Generic Upload FAST处上传在23魔方所下载的原始/扩展数据。点击Generic Upload FAST,等待页面跳转

(3)在跳转至数据传输页面,至少需要填写如下所示信息。包含姓名,别名(可选),性别,授权选择yes,再点击选择文件,在弹出的本地窗口里选择你所下载的原始数据。然后点击upload。注意,如果是上传1200万扩展数据,不能进行解压,因数据比较大,上传时间所需时间较长,经测试,大概需要10分钟。

(4)数据上传成功会跳转到一个在末尾显示Finished的页面,会展示你所上传成功的数据编号(kit number)

同时,也可以在你所登录的主页面查看到你刚刚所上传的数据编号和对应状态,即Kit number。

(5)数据上传成功之后,可在网站右栏中进行相应的分析。(Phased分析不仅需要你的数据集,同时还需要您父母的原始数据集)。下面展示血统分析和瞳孔颜色预测。即Admixture Utilities分析与Predict Eye Color。首先点击Admixture(heritage)。

(6)在跳转的新页面里面的project的下拉框中,选中MDLP Project,然后再点击Continue。

(7)接着输入你所上传的数据编号,即上文中提到的在主页面上Your DNA Resources栏中的Kit number。然后在第二个选项的下拉框里选择计算模型,本示例选择的为MDLP World-22,您也可以选择其他不同的计算模型,可能会得到稍有差异的结果。接着点击Continue。

(8)接着就会弹出你的分析结果,本示例所用数据集的分析结果显示,具有75.64%的东南亚血统,19.13%的东西伯利亚血统,2.27%的印藏血统以及1.32%的大西洋地中海新石器时代血统(我也不知道这是什么血统)

(9)以上分析为血统分析,接下来返回主页面,在主页面右栏的Analyze Your Date点击Predict Eye Color,然后等待页面跳转,在新页面里的空栏中输入你的数据编号(kit number),然后点击Predict Color。

(10)稍等片刻就会得到你瞳孔颜色的预测结果,在网页底端,你可对你的预测结果的准确性进行评估,同时,你也可以填写你的评价提交给GEDmatch网站。
当然国外的网站都是针对欧美人群以及23andme老版本的芯片进行分析的,准不准确就见仁见智了。:)
(END)
叶子哥
点赞
东瓯
点赞