当前位置: 首页>编程语言>正文

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程

TASSEL的官方网站:https://tassel.bitbucket.io/
在TASSEL的下载文件夹中...\TASSEL5\TutorialData有示例数据 用此数据进行演示

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第1张
图片1.png

依次为基因型数据、亲缘关系、表现型数据(这里面包含了分群、表型性状、群体结构)、群体结构、表型性状。
实际只用到基因型数据、群体结构、和表型性状。TASSEL是可以通过基因型数据计算亲缘关系的。

一、加载数据

点击File → Open
将基因型数据、群体结构和表型性状导入进来。(mdp_genotype.hmp、mdp_phenotype、mdp_traits这三个文件)


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第2张
图片2.png

二、计算亲缘关系

对基因型文件进行过滤
选择基因型数据 点击Filter → Sites


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第3张
图片3.png

进行设置 → 点击Filter


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第4张
图片4.png

(此处的标准都是按照TASSEL指导手册中进行设置的)
点击Analysis → Relatedness → Kinship


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第5张
图片5.png

点击OK


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第6张
图片6.png

就得到了亲缘关系的矩阵


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第7张
图片7.png

三、关联分析(一般线性模型)

对基因型文件进行过滤
注意:这里用到的是上一步进行亲缘关系分析时过滤后的文件

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第8张
图片8.png

在此文件的基础上再次进行过滤 点击Filter → Sites
设置过滤条件 点击Filter
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第9张
图片9.png

得到过滤后的基因型数据


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第10张
图片10.png

选择性状数据 点击Filter → Traits
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第11张
图片11.png

选择其中一个性状,点击OK
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第12张
图片12.png

得到其中一个表型数据
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第13张
图片13.png

选择群体结构 点击Filter → Traits
将最后一个群体结构(Q3)去掉,指导手册中给出的解释是“如果我们把它们全部作为协变量使用,这会产生线性相依性”。
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第14张
图片14.png

得到过滤后的群体结构数据
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第15张
图片15.png

摁住Ctrl键同时选中上述三个文件进行合并 点击Data → Intersect Join
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第16张
图片16.png

得到合并后的数据集
选中合并后的数据集 点击Analysis → Association → GLM
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第17张
图片17.png

点击OK
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第18张
图片18.png

其中Help选项中有该页面参数的解释和默认值,还可以点击User Manual查看更详细的内容。
得到最终结果文件
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第19张
图片19.png

数据可视化
点击Results → QQ Plot/Manhattan Plot
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第20张
图片20.png

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第21张
图片21.png

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第22张
图片22.png

四、关联分析(混合线性模型)

混合线性模型即将群体结构和亲缘关系作为协变量来进行分析
摁住Ctrl键同时选中上述提到的一般线性模型中合并后的数据集和亲缘关系矩阵


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第23张
图片23.png

点击Analysis → Association → MLM


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第24张
图片24.png

进行设置 点击RUN → 点击 OK
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第25张
图片25.png

得到最终结果文件
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第26张
图片26.png

数据可视化
点击Results → QQ Plot/Manhattan Plot


GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第27张
图片27.png

GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第28张
图片28.png

实际上关联分析输出的结果中只有Trait、Marker、Chr、Pos、p值是用到比较多的,Q-Qplot和曼哈顿图也是基于此几个值进行绘制的,我们可以将这几列提取出来在R语言中进行绘图。
GWAS全基因组关联分析:TASSEL 5.0 Windows版软件使用教程,第29张
图片29.png

参考:

https://bitbucket.org/tasseladmin/tassel-5-source/wiki/UserManual

Tassel5UserGuide


https://www.xamrdz.com/lan/5vm2016360.html

相关文章: