GWAS数据分析专题
全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等统计方法,快速分析与表型相关联的SNP位点。本文整理了GWAS数据分析相关的资料。
GWAS芯片是常用的SNP分型平台,但是其位点相比全基因组还是不够,此时可以通过基因型填充技术提高SNP位点数目
• GWAS中的genotype imputation简介
• 基因型填充中的phasing究竟是什么
• 基因型填充前的质控条件简介
• 使用shapeit进行单倍型分析
• 使用Eagle2进行单倍型分析
• Haplotype Reference Consortium:最大规模的单倍型数据库
• 使用IMPUTE2进行基因型填充
• 使用Beagle进行基因型填充
• 使用Minimac进行基因型填充
• 文献解读|不同基因型填充软件性能的比较
• Michigan Imputation Server:基因型填充的在线工具
对分型结果进行质控后,就可以进行了GWAS分析了。GWAS的基本分析中设计到了卡方检验,费舍尔精确检验,线性回归,逻辑回归等统计方法
• 卡方检验在关联分析中的应用
• 费舍尔精确检验在关联分析中的应用
• Cochran-Armitage趋势检验在关联分析中的应用
• Cochran-Mantel-Haenszel检验在关联分析中的应用
• odd ratio值在关联分析中的含义
• 线性回归的这些细节,你都搞明白了吗?
• 没想到你是这个样子的置信区间
• 逻辑回归or线性回归,傻傻分不清楚
• 自己动手进行逻辑回归,你也可以!
• odd ratio置信区间的计算,你学会了吗?
• 多元回归分析存在多重共线性了怎么办?
对于GWAS的分析结果,最常见的图表就是QQ图和曼哈顿图,以及locuszoom
• 一文搞懂Q-Q plot图的含义
• 3分钟掌握曼哈顿图的绘制
• 曼哈顿图就够了吗?你还需要LocusZoom
传统的GWAS分析对象为SNP, 还可以进一步在gene, pathway等水平来进行关联研究
• GWAS大家都知道,Gene-Based GWAS你了解吗?
• 3步搞定GWAS中的Gene Set Analysis
• GWAS做完了,下一步做什么?
meta分析可以整合多个gwas分析的结果,增大样本量,提高检验效能
• GWAS样本量不够怎么办,meta分析了解一下
• 你没看错,搞定GWAS meta分析只需一行代码!
• meta分析的森林图不会画?看这里
• GWAMA:GWAS meta-analysis的又一利器
• 点击鼠标即可完成GWAS meta分析,任何人都可以!
• 用R进行gwas meta分析,原来如此简单
也可以将基因和基因之间的互作,基因和环境因素之间的互作考虑进来,一起分析
• 基因型与表型的交互作用如何分析,多元回归来搞定
• 你听说过Epistasis吗?
• GWAS中的Gene-Gene Interactions如何分析?看这里
• 终于搞清楚了Lasso回归和Ridge回归的区别
• 用R进行Lasso regression回归分析
• 多因子降维法MDR分析GxG, GxE交互作用
• MDR多因子降维分析实战
• MDR的进阶版本-GMDR
GWAS除了识别与表型关联的位点,还有很多应用
• polygenic risk score:多基因风险评分
• 使用PRSice进行多基因风险评分分析
• 什么是SNP遗传力?
• LDSC:连锁不平衡回归分析
• LDSC分析实战
• 不会linux也没关系,点击鼠标即可完成的LDSC分析来了
• 想要进行gene prioritization分析,请看这里!
• 衡量样本亲缘关系,除了IBD你还知道哪些方法?
• Linear Mixde Model:线性混合模型简介
• 一文掌握inbreeding coefficient近交系数的计算
• 使用GCTA的GREML评估SNP遗传力
GWAS经过这么多年的发展,有很多已发表的公开数据集被收录到数据库中
• GWAS ATLAS:最全面的GWAS数据库
• GWAS公开结果哪里找,GWAS Catalog来帮忙
GWAS要求的样本量很大,可以看到别人发表的高分文章中样本量在几千到几万的水平,整个实验的话费是比较高昂的。在GWAS的分析中,核心就是各种统计学方法的应用。
·end·
—如果喜欢,快分享给你的朋友们吧—
往期精彩
• 自己动手进行逻辑回归,你也可以!
• GWAS大家都知道,Gene-Based GWAS你了解吗?
• 3步搞定GWAS中的Gene Set Analysis
• 你听说过Epistasis吗?
• GWAS中的Gene-Gene Interactions如何分析?看这里
• 终于搞清楚了Lasso回归和Ridge回归的区别
• odd ratio置信区间的计算,你学会了吗?
• 多元回归分析存在多重共线性了怎么办?
• 基因型与表型的交互作用如何分析,多元回归来搞定
• 曼哈顿图就够了吗?你还需要LocusZoom
• GWAS做完了,下一步做什么?
GWAS meta分析
• GWAS样本量不够怎么办,meta分析了解一下
• 你没看错,搞定GWAS meta分析只需一行代码!
• meta分析的森林图不会画?看这里
• GWAMA:GWAS meta-analysis的又一利器
• 点击鼠标即可完成GWAS meta分析,任何人都可以!
• 用R进行gwas meta分析,原来如此简单
基因型填充
• GWAS中的genotype imputation简介
• 基因型填充中的phasing究竟是什么
• 基因型填充前的质控条件简介
• 使用shapeit进行单倍型分析
• gtool:操作genotype data的利器
• 使用IMPUTE2进行基因型填充
• 使用Beagle进行基因型填充
• 使用Minimac进行基因型填充
• 使用Eagle2进行单倍型分析
• X染色体的基因型填充
• 文献解读|不同基因型填充软件性能的比较
• Haplotype Reference Consortium:最大规模的单倍型数据库
• Michigan Imputation Server:基因型填充的在线工具
CNV分析
• aCGH芯片简介
• aCGH芯片分析简介
• 基于SNP芯片进行CNV分析中的基本知识点
• PennCNV:利用SNP芯片检测CNV
• DGV:人类基因组结构变异数据库
• dbvar:染色体结构变异数据库
• DGVa:染色体结构变异数据库
• CNVD:疾病相关的CNV数据库
• DECIPHER:疾病相关的CNV数据库
• 全基因组数据CNV分析简介
• 使用CNVnator进行CNV检测
• 使用lumpy进行CNV检测
• CNVnator原理简介
• WES的CNV分析简介
• XHMM分析原理简介
• 使用conifer进行WES的CNV分析
• 使用EXCAVATOR2检测WES的CNV
• 靶向测序的CNV分析简介
• 使用CNVkit进行CNV分析
• DECoN:最高分辨率的CNV检测工具
TCGA
• TCGA数据库简介
• 使用GDC在线查看TCGA数据
• 使用gdc-client批量下载TCGA数据
• 一文搞懂TCGA中的分析结果如何来
• 通过GDC Legacy Archive下载TCGA原始数据
• 使用GDC API查看和下载TCGA的数据
• 使用GDC下载TCGA肿瘤患者的临床信息
• 使用TCGAbiolinks下载TCGA的数据
• 使用TCGAbiolinks进行生存分析
• 使用TCGAbiolinks分析TCGA中的表达谱数据
• 使用TCGAbiolinks进行甲基化和转录组数据的联合分析
• Broad GDAC:TCGA数据分析中心
• 使用cBioPortal查看TCGA肿瘤数据
• UCSC Xena:癌症基因组学数据分析平台
• GEPIA:TCGA和GTEx表达谱数据分析平台
• TANRIC:肿瘤相关lncRNA数据库
• SurvNet:基于网络的肿瘤biomarker基因查找算法
• TCPA:肿瘤RPPA蛋白芯片数据中心
• TCGA Copy Number Portal:肿瘤拷贝数变异数据中心
生存分析
• 生存分析详细解读
• 用R语言进行KM生存分析
• 使用OncoLnc进行TCGA生存分析
• 用R语言进行Cox回归生存分析
• 使用kmplot在线进行生存分析
肿瘤数据库
• ICGC:国际肿瘤基因组协会简介
• HPA:人类蛋白图谱数据库
• Oncomine:肿瘤芯片数据库
• ONGene:基于文献检索的肿瘤基因数据库
• oncomirdb:肿瘤相关的miRNA数据库
• TSGene:肿瘤抑癌基因数据库
• NCG:肿瘤驱动基因数据库
• mutagene:肿瘤突变频谱数据库
• CCLE:肿瘤细胞系百科全书
• mSignatureDB:肿瘤突变特征数据库
• GTEx:基因型和基因表达量关联数据库
肿瘤免疫和新抗原
• Cancer-Immunity Cycle:肿瘤免疫循环简介
• TMB:肿瘤突变负荷简介
• 肿瘤微环境:Tumor microenvironment (TME)简介
• 肿瘤浸润免疫细胞量化分析简介
• 使用EPIC预测肿瘤微环境中免疫细胞构成
• TIMER:肿瘤浸润免疫细胞分析的综合网站
• quanTIseq:肿瘤浸润免疫细胞定量分析
• The Cancer Immunome Atlas:肿瘤免疫图谱数据库
• 肿瘤新抗原简介
• TSNAdb:肿瘤新抗原数据库
• 使用NetMHCpan进行肿瘤新抗原预测分析
Hi-C数据分析
• chromosome-territories:染色质疆域简介
• chromosome conformation capture:染色质构象捕获技术
• 3C的衍生技术简介
• 解密Hi-C数据分析中的分辨率
• A/B compartment:染色质区室简介
• TAD:拓扑关联结构域简介
• chromatin loops:染色质环简介
• Promoter Capture Hi-C:研究启动子区染色质互作的利器
• 使用HiCUP进行Hi-C数据预处理
• Juicer:Hi-C数据处理分析的利器
• Juicer软件的安装详解
• Juicebox:Hi-C数据可视化利器
• Juicer实战详解
• HiC-Pro:灵活的Hi-C数据处理软件
• HiC-Pro实战详解
• 3D Genome Browser:Hi-C数据可视化工具
• HiCPlotter:Hi-C数据可视化工具
• 3CDB:基于3C技术的染色质互作信息数据库
• 3DIV:染色质空间互作数据库
• 4DGenome:染色质相互作用数据库
• 4D nucleome project:染色质三维结构研究必不可少的参考项目
• 3dsnp:SNP在染色质环介导的网络中的分布数据库
• iRegNet3D:疾病相关SNP位点在三维网络中的作用
• 使用WashU Epigenome Browser可视化hi-c数据
• HiGlass:高度定制的Hi-C数据可视化应用
• Hi-C Data Browser:Hi-C数据浏览器
• 使用FitHiC评估染色质交互作用的显著性
• 使用TADbit识别拓扑关联结构域
• 使用pyGenomeTracks可视化hi-c数据
• hi-c辅助基因组组装简介
• 文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装
chip_seq数据分析
• Chip-seq简介
• chip_seq质量评估之计算样本间的相关性
• chip_seq质量评估之查看抗体富集效果
• chip_seq质量评估之PCA分析
• chip_seq质量评估之coverage分析
• chip_seq质量评估之FRiP Score
• chip_seq质量评估之cross correlation
• chip_seq质量评估之文库复杂度
• depth, bedgraph, bigwig之间的联系与区别
• bigwig归一化方式详解
• 使用igvtools可视化测序深度分布
• 使用UCSC基因组浏览器可视化测序深度分布数据
• 使用deeptools查看reads分布特征
• 使用phantompeakqualtools进行cross correlation分析
• blacklist regions:NGS测序数据中的黑名单
• MACS:使用最广泛的peak calling软件之一
• MACS2 peak calling实战
• 使用SICER进行peak calling
• 使用HOMER进行peak calling
• peak注释信息揭秘
• PAVIS:对peak区域进行基因注释的在线工具
• 使用UPORA对peak进行注释
• 使用GREAT对peak进行功能注释
• annoPeakR:一个peak注释的在线工具
• 使用ChIPpeakAnno进行peak注释
• 使用ChIPseeker进行peak注释
• 使用PeakAnalyzer进行peak注释
• 使用homer进行peak注释
• 利用bedtools预测chip_seq数据的靶基因
motif
• 关于motif你需要知道的事
• 详解motif的PFM矩阵
• 详解motif的PWM矩阵
• 使用WebLogo可视化motif
• 使用seqLogo可视化motif
• 使用ggseqlogo可视化motif
• MEME:motif分析的综合性工具
• 使用MEME挖掘序列中的de novo motif
• 使用DREME挖掘序列中的de novo motif
• 使用MEME-ChIP挖掘序列中的de novo motif
chip_seq数据库
• ENCODE project项目简介
• FactorBook:人和小鼠转录因子chip_seq数据库
• ReMap:人类Chip-seq数据大全
• IHEC:国际人类表观基因组盟
• Epifactors:表观因子数据库
• GTRD:最全面的人和小鼠转录因子chip_seq数据库
• ChIP-Atlas:基于公共chip_seq数据进行分析挖掘
• Cistrome DB:人和小鼠的chip_seq数据库
• chipBase:转录因子网络数据
• unibind:human转录因子结合位点数据库
• chip_seq在增强子研究中的应用
• DENdb:human增强子数据库
• VISTA:人和小鼠的增强子数据库
• EnhancerAtlas:人和小鼠的增强子数据库
• FANTOM5:人类增强子数据库
• TiED:人类组织特异性增强子数据库
• HEDD:增强子疾病相关数据库
• HACER:human增强子数据库
• SEdb:超级增强子数据库简介
• dbSUPER:人和小鼠中的超级增强子数据库
• dbCoRC:核心转录因子数据库
• 使用ROSE鉴定超级增强子
18年文章目录
• 2018年推文合集