micromamba install -n r_libs r-pecotmr

# If an error occurs while sourcing scripts, it might be because your get() returned NULL. 
#Please restart the kernel or click the R kernel in the upper right corner to resolve the issue.
source('../../codes/cb_plot.R')
source('../../codes/utilis.R')

for(file in list.files("/data/colocalization/colocboost/R", pattern = ".R", full.names = T)){
          source(file)
        }
gene_name = 'GRN'

dir.create(paste0('plots/', gene_name), recursive = T)

target_gene_info <- get_gene_info(gene_name = gene_name)
target_gene_info

gene_id = target_gene_info$gene_info$region_id
chrom = target_gene_info$gene_info$`#chr`

source('../../codes/utilis.R')
expression_in_rosmap_bulk(target_gene_info)

region_p

pip_p

cb_res <- readRDS(paste0("/data/analysis_result/ColocBoost/2024_9/",gene_id,"_res.rds") )

#save colocboost results
cb_res_table <- get_cb_summary(cb_res) 

saveRDS(cb_res_table, paste0(gene_name, "_colocboost_res.rds"))

cb <- plot_cb(cb_res = cb_res, cex.pheno = 1.5, x.phen = -0.2)

pdf('plots/GRN/sec2.colocboost_res.pdf', width = 10, height = 5)
replayPlot(cb$p)
dev.off()

# colocalized variants
cb_res_table

# effect sign for each coloc sets
get_effect_sign_csets(cb_res)

# LD between coloc sets
get_between_purity_simple(cb_res, gene.name = gene_id, path = '/data/colocalization/QTL_data/eQTL/')

AD_cohorts <- c('AD_Jansen_2021', 'AD_Bellenguez_EADB_2022', 'AD_Bellenguez_EADI_2022',
             'AD_Kunkle_Stage1_2019', 'AD_Wightman_Excluding23andMe_2021',
             'AD_Wightman_ExcludingUKBand23andME_2021', 'AD_Wightman_Full_2021')
cb_ad <- plot_cb(cb_res = cb_res, cex.pheno = 1.5, x.phen = -0.2, add_gwas = TRUE, gene_id = gene_id, cohorts = AD_cohorts)

No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.No pvalue cutoff. Extract all variants names.

pdf('plots/GRN/sec3.colocboost_res_allad.pdf', width = 10, height = 5)
replayPlot(cb_ad$p)
dev.off()

mash_p <- mash_plot(gene_name = 'GRN')

options(repr.plot.width = 10, repr.plot.height = 10)

for (mash_p_tmp in mash_p) {
    print(mash_p_tmp)
}

plot_TWAS_res(gene_id = gene_id, gene_name = gene_name)

multigene_flat <- get_multigene_multicontext_flatten('Fungen_xQTL_allQTL.overlapped.gwas.export.GRN.rds', sQTL = 'no_MSBB')
multigene_flat

sliding_windows <- target_gene_info$gene_info$sliding_windows %>% strsplit(., ',') %>% unlist %>% as.character
sliding_windows

mnm_gene <- list()
for (window in sliding_windows) {
    mnm_gene_tmp <- NULL
    mnm_gene_tmp <- tryCatch(
        readRDS(paste0('/data/analysis_result/mvsusie_multi_gene/multi_gene/ROSMAP_multi_gene.', window, '.mnm.rds')),
        error = function(e) NULL
    )
    
    if (!is.null(mnm_gene_tmp)) {
        if(target_gene_info$gene_info$region_id %in% mnm_gene_tmp$mvsusie_fitted$condition_names){
        tryCatch({
            p <- mvsusieR::mvsusie_plot(mnm_gene_tmp$mvsusie_fitted, sentinel_only = F, add_cs = T)
            print(p)  # This ensures the plot is displayed in JupyterLab
        }, error = function(e) NULL)
        } else {
            message('There is mnm result for sliding window ',window,', but not include target gene ', gene_name, ' in CS')
        }
        mnm_gene <- append(mnm_gene, list(mnm_gene_tmp))
    }
}

options(repr.plot.width = 40, repr.plot.height = 40)

 ggplot() + theme_bw() +  facet_grid(cs_coverage_0.95+study + region ~ ., labeller = labeller(.rows = function(x) gsub("([_:,-])", "\n", x)), scale = "free_y") +

      theme(text = element_text(size = 20), strip.text.y = element_text(size = 25, angle = 0.5)) +
     # xlim(view_win) +
      ylab("Estimated effect") +
   #   geom_line(data = haQTL_df %>% mutate(study = "haQTL effect") %>% filter(CS == 5),
    #            aes_string(y = "fun_plot", x = "x", col = "CS"), size = 4, col = "#00AEEF") +
  geom_line(data = effect_of_interest ,
                aes_string(y = "fun_plot", x = "x", col = "cs_coverage_0.95"), size = 4) +  
    geom_point(data = effect_of_interest ,
                aes_string(y = "pip", x = "pos", col = "cs_coverage_0.95"), size = 4) +
    theme(text = element_text(size = 40), strip.text.y = element_text(size = 15, angle = 0.5), 
            axis.text.x = element_text(size = 40), axis.title.x = element_text(size = 40)) +
      xlab("Position") +
      ylab("Estimated\neffect") +
      geom_segment(arrow = arrow(length = unit(1, "cm")), aes(x = gene_start, xend = gene_end, y = 1, yend = 1), size = 6,
                  data = tar_gene_info$gene_info, alpha = 0.3) +
      geom_text(aes(x = (gene_start + gene_end) / 2, y = 1 , label = gene_name), size = 10, 
              data = tar_gene_info$gene_info)+
        geom_point(aes(x = pos, y = pip  ) ,color = "red", data = flatten_table%>%filter( str_detect(study,"AD_") , cs_coverage_0.95 != 0  )%>%mutate(AD_study = study%>%str_replace_all("_","\n" ))%>%select(-study,-region,-cs_coverage_0.95) )

finempping_contexts <- readRDS(paste0(gene_name, '_finemapping_contexts.rds')) # from sec1

finempping_contexts <- get_norosmap_contexts(finempping_contexts)

cb_contexts <- plot_cb(cb_res = cb_res, cex.pheno = 1.5, x.phen = -0.2, add_QTL = TRUE, cohorts = finempping_contexts, gene_id = gene_id)

options(repr.plot.width=6, repr.plot.height=6)

ggplot(GRN_int_res, aes(x = variant_id, y = qvalue_interaction)) +
  geom_point(alpha = 0.7, size = 6) +
  labs(title = "qvalue for GRN csets in interaction association nalysis",
       x = "Gene Name",
       y = "qvalue_interaction",
       size = "qvalue_interaction") +
  theme_minimal(base_size = 14) +
  theme(panel.background = element_blank(),
        panel.grid.major = element_line(color = "grey80"),
        legend.position = NULL,
        axis.text.x = element_text(angle = 45, hjust = 1))  + ylim(0,1)
  # scale_color_manual(values = colorRampPalette(brewer.pal(8, "Set1"))(length(unique(flat_var$gene_name))))
ggsave('plots/GRN/sec11.interaction_association_GRN_lessPIP25.pdf', height = 5, width = 8)

vars_p

apoe_p

func_p

options(repr.plot.width=12, repr.plot.height=6)
if(!is.null(flat_var)){
    ggplot(flat_var, aes(x = gene_name, y = pip, size = pip)) +
      geom_point(alpha = 0.7) +
      labs(title = paste0("PIP values for trans fine mapped Genes in ", gene_name ," csets with AD"),
           x = "Gene Name",
           y = "PIP",
           size = "PIP",
           color = "CS Coverage 0.95 Min Corr") +
      theme_minimal(base_size = 14) +
      theme(panel.background = element_blank(),
            panel.grid.major = element_line(color = "grey80"),
            legend.position = NULL,
            axis.text.x = element_text(angle = 45, hjust = 1))  
      # scale_color_manual(values = colorRampPalette(brewer.pal(8, "Set1"))(length(unique(flat_var$gene_name))))
    ggsave(paste0('plots/GRN/sec12.trans_fine_mapping_',gene_name,'.pdf'), height = 5, width = 8)
} else{
    message('There are no detectable trans signals for ', gene_name)
}

region_id	#chr	start	end	TSS	LD_matrix_id	LD_sumstats_id	LD_sumstats_id_old	TADB_index	TADB_id	gene_start	gene_end	sliding_windows	gene_name
<chr>	<chr>	<dbl>	<dbl>	<int>	<chr>	<chr>	<chr>	<chr>	<chr>	<int>	<int>	<chr>	<chr>
ENSG00000030582	chr17	42560000	46680000	44345261	chr17:42087601-45383525,chr17:45383525-50162864	17_42087601-45383525,17_45383525-50162864	17_42087601-45383525,17_45383525_50162864	TADB_1194,TADB_1195	chr17_40717742_44389199,chr17_41536509_47757464	44345262	44353106	chr17:30937006-42930542,chr17:34918066-44389199,chr17:36924414-47757464,chr17:40717742-51756219,chr17:41536509-52297936,chr17:45274784-55961956	GRN

colocalized phenotypes	purity	# variants	highest VCP	colocalized index	colocalized variants	max_abs_z_variant	cset_id
<chr>	<dbl>	<dbl>	<dbl>	<chr>	<chr>	<chr>	<chr>
Ast; Oli; Exc; Inh; DLPFC; AC; PCC; AD_Bellenguez_2022	1	1	1	6346	chr17:44352876:C:T	chr17:44352876:C:T	coloc_sets:Y2_Y3_Y5_Y6_Y7_Y8_Y9_Y17:CS1

	variants	Ast	Oli	Exc	Inh	DLPFC	AC	PCC	AD_Bellenguez_2022
	<chr>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>
chr17:44352876:C:T	chr17:44352876:C:T	-3.359053	-4.94038	-8.02911	-3.790964	-10.31302	-14.40894	-12.71331	7.021739

gene_id	#chr	start	end	gene_name	contexts
<chr>	<chr>	<int>	<int>	<chr>	<chr>
ENSG00000004939	chr17	44268134	44268135	SLC4A1	MiGA_THA_eQTL
ENSG00000005102	chr17	43661921	43661922	MEOX1	MiGA_THA_eQTL
ENSG00000005961	chr17	44389648	44389649	ITGA2B	Exc_Kellis_eQTL,Exc_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000012048	chr17	43170244	43170245	BRCA1	MiGA_SVZ_eQTL,MiGA_THA_eQTL,Exc_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000013306	chr17	44324869	44324870	SLC25A39	Knight_eQTL,BM_10_MSBB_eQTL,BM_36_MSBB_eQTL,Exc_DeJager_eQTL,Inh_DeJager_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL,AC_DeJager_eQTL,Oli_Kellis_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Exc_mega_eQTL,Inh_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL,STARNET_eQTL
ENSG00000037042	chr17	42659283	42659284	TUBG2	MiGA_THA_eQTL
ENSG00000067596	chr17	43483864	43483865	DHX8	ROSMAP_DLPFC_sQTL
ENSG00000068120	chr17	42561466	42561467	COASY	ROSMAP_PCC_sQTL
ENSG00000068137	chr17	42676993	42676994	PLEKHH3	Inh_mega_eQTL,ROSMAP_AC_sQTL
ENSG00000073670	chr17	44758987	44758988	ADAM11	MiGA_GTS_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000073969	chr17	46590668	46590669	NSF	Exc_DeJager_eQTL,AC_DeJager_eQTL,Mic_Kellis_eQTL,Oli_Kellis_eQTL,OPC_Kellis_eQTL,Exc_Kellis_eQTL,Exc_mega_eQTL,Inh_mega_eQTL,Oli_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL
ENSG00000087152	chr17	44200112	44200113	ATXN7L3	MiGA_GTS_eQTL
ENSG00000091947	chr17	44023945	44023946	TMEM101	MiGA_GTS_eQTL,ROSMAP_PCC_sQTL
ENSG00000108309	chr17	44308582	44308583	RUNDC3A	MiGA_GTS_eQTL,MiGA_THA_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL
ENSG00000108771	chr17	42112713	42112714	DHX58	MiGA_GTS_eQTL
ENSG00000108786	chr17	42552922	42552923	HSD17B1	Oli_mega_eQTL
ENSG00000108797	chr17	42682530	42682531	CNTNAP1	DLPFC_Klein_gpQTL
ENSG00000108799	chr17	42745048	42745049	EZH1	ROSMAP_PCC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000108821	chr17	50201630	50201631	COL1A1	ROSMAP_PCC_sQTL
ENSG00000108825	chr17	42980527	42980528	PTGES3L-AARSD1	ROSMAP_AC_sQTL
ENSG00000108828	chr17	43025122	43025123	VAT1	BM_22_MSBB_eQTL
ENSG00000108830	chr17	43025230	43025231	RND2	STARNET_eQTL
ENSG00000108840	chr17	44123701	44123702	HDAC5	DLPFC_Bennett_pQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000108852	chr17	43909710	43909711	MPP2	MiGA_GFM_eQTL,MiGA_SVZ_eQTL,DLPFC_DeJager_eQTL,AC_DeJager_eQTL,Ast_mega_eQTL,ROSMAP_DLPFC_sQTL
ENSG00000108861	chr17	43778976	43778977	DUSP3	MiGA_SVZ_eQTL,Oli_Kellis_eQTL
ENSG00000108883	chr17	44899444	44899445	EFTUD2	MiGA_THA_eQTL,BM_44_MSBB_eQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL
ENSG00000120071	chr17	46225388	46225389	KANSL1	Knight_eQTL,MiGA_GTS_eQTL,MiGA_SVZ_eQTL,BM_10_MSBB_eQTL,BM_22_MSBB_eQTL,BM_36_MSBB_eQTL,BM_44_MSBB_eQTL,Mic_DeJager_eQTL,Ast_DeJager_eQTL,Oli_DeJager_eQTL,OPC_DeJager_eQTL,Exc_DeJager_eQTL,Inh_DeJager_eQTL,AC_DeJager_eQTL,Inh_Kellis_eQTL,Ast_10_Kellis_eQTL,Mic_13_Kellis_eQTL,Exc_mega_eQTL,Mic_mega_eQTL,OPC_mega_eQTL,Oli_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL,ROSMAP_DLPFC_sQTL,STARNET_eQTL
ENSG00000120088	chr17	45784279	45784280	CRHR1	ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL
ENSG00000121073	chr17	49709013	49709014	SLC35B1	monocyte_ROSMAP_eQTL
ENSG00000126562	chr17	42780609	42780610	WNK4	MiGA_SVZ_eQTL
...	...	...	...	...	...
ENSG00000167941	chr17	43758790	43758791	SOST	MiGA_THA_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL
ENSG00000168259	chr17	42021375	42021376	DNAJC7	ROSMAP_DLPFC_sQTL
ENSG00000168517	chr17	45160699	45160700	HEXIM2	MiGA_GTS_eQTL,ROSMAP_PCC_sQTL
ENSG00000168591	chr17	44186969	44186970	TMUB2	MiGA_THA_eQTL,MSBB_BM36_pQTL
ENSG00000168610	chr17	42388539	42388540	STAT3	ROSMAP_PCC_sQTL
ENSG00000172992	chr17	45061108	45061109	DCAKD	MiGA_GFM_eQTL,MiGA_GTS_eQTL,BM_44_MSBB_eQTL,Exc_DeJager_eQTL,DLPFC_DeJager_eQTL,AC_DeJager_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Exc_mega_eQTL,DLPFC_Bennett_pQTL
ENSG00000173757	chr17	42276706	42276707	STAT5B	MiGA_GFM_eQTL
ENSG00000173805	chr17	41734643	41734644	HAP1	BM_10_MSBB_eQTL,ROSMAP_PCC_sQTL
ENSG00000175832	chr17	43579619	43579620	ETV4	Inh_DeJager_eQTL
ENSG00000176681	chr17	46292732	46292733	LRRC37A	Knight_eQTL,MiGA_GFM_eQTL,MiGA_GTS_eQTL,MiGA_THA_eQTL,BM_10_MSBB_eQTL,BM_22_MSBB_eQTL,BM_36_MSBB_eQTL,BM_44_MSBB_eQTL,Ast_DeJager_eQTL,Oli_DeJager_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL,AC_DeJager_eQTL,Inh_mega_eQTL,monocyte_ROSMAP_eQTL
ENSG00000180336	chr17	44656403	44656404	MEIOC	MiGA_THA_eQTL
ENSG00000181513	chr17	45132599	45132600	ACBD4	MiGA_THA_eQTL,Exc_mega_eQTL,ROSMAP_DLPFC_sQTL
ENSG00000182963	chr17	44830815	44830816	GJC1	BM_44_MSBB_eQTL
ENSG00000183978	chr17	42798703	42798704	COA3	MiGA_SVZ_eQTL
ENSG00000184922	chr17	45221443	45221444	FMNL1	MiGA_SVZ_eQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000185829	chr17	46579690	46579691	ARL17A	MiGA_GTS_eQTL,MiGA_SVZ_eQTL,BM_10_MSBB_eQTL,BM_22_MSBB_eQTL,BM_36_MSBB_eQTL,BM_44_MSBB_eQTL,Ast_DeJager_eQTL,PCC_DeJager_eQTL,AC_DeJager_eQTL,Mic_Kellis_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Exc_mega_eQTL,OPC_mega_eQTL,Oli_mega_eQTL,monocyte_ROSMAP_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,STARNET_eQTL
ENSG00000186566	chr17	44503405	44503406	GPATCH8	Ast_10_Kellis_eQTL,Exc_mega_eQTL,Inh_mega_eQTL
ENSG00000186834	chr17	45148474	45148475	HEXIM1	MiGA_GTS_eQTL
ENSG00000186868	chr17	45894526	45894527	MAPT	Ast_10_Kellis_eQTL,ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL
ENSG00000188554	chr17	43170480	43170481	NBR1	MiGA_SVZ_eQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL
ENSG00000198863	chr17	42980564	42980565	RUNDC1	MiGA_SVZ_eQTL,BM_44_MSBB_eQTL
ENSG00000214447	chr17	44899711	44899712	FAM187A	ROSMAP_AC_sQTL,ROSMAP_PCC_sQTL
ENSG00000225190	chr17	45490748	45490749	PLEKHM1	PCC_DeJager_eQTL,AC_DeJager_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Exc_mega_eQTL,Inh_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL
ENSG00000228696	chr17	46361796	46361797	ARL17B	Knight_eQTL,MiGA_GFM_eQTL,BM_10_MSBB_eQTL,BM_22_MSBB_eQTL,BM_36_MSBB_eQTL,BM_44_MSBB_eQTL,Mic_DeJager_eQTL,Oli_DeJager_eQTL,OPC_DeJager_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL,Mic_Kellis_eQTL,Oli_Kellis_eQTL,OPC_Kellis_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Ast_mega_eQTL,Exc_mega_eQTL,Inh_mega_eQTL,OPC_mega_eQTL,Oli_mega_eQTL,STARNET_eQTL
ENSG00000231256	chr17	43780434	43780435	CFAP97D1	DLPFC_DeJager_eQTL
ENSG00000236383	chr17	43305396	43305397	CCDC200	MiGA_SVZ_eQTL
ENSG00000238083	chr17	46511510	46511511	LRRC37A2	MiGA_SVZ_eQTL,MiGA_THA_eQTL,BM_22_MSBB_eQTL,BM_36_MSBB_eQTL,Mic_DeJager_eQTL,Ast_DeJager_eQTL,Oli_DeJager_eQTL,OPC_DeJager_eQTL,Exc_DeJager_eQTL,Inh_DeJager_eQTL,DLPFC_DeJager_eQTL,PCC_DeJager_eQTL,AC_DeJager_eQTL,Mic_Kellis_eQTL,Ast_Kellis_eQTL,Oli_Kellis_eQTL,OPC_Kellis_eQTL,Exc_Kellis_eQTL,Inh_Kellis_eQTL,Ast_mega_eQTL,Exc_mega_eQTL,Inh_mega_eQTL,OPC_mega_eQTL,Oli_mega_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL,STARNET_eQTL
ENSG00000262633	chr17	46923132	46923133	AC005670.2	Inh_Kellis_eQTL
ENSG00000263715	chr17	45620343	45620344	LINC02210-CRHR1	Exc_Kellis_eQTL,Inh_Kellis_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL,ROSMAP_PCC_sQTL
ENSG00000267060	chr17	42980432	42980433	PTGES3L	MiGA_GTS_eQTL,MiGA_THA_eQTL,ROSMAP_AC_sQTL,ROSMAP_DLPFC_sQTL

Case study: GRN xQTL and AD GWAS¶

Overview¶

Computing environment setup¶

How to Use This Notebook¶

Section 0: Sanity check ¶

Check the basic information of the gene¶

Check the existing results which are inputs to this analysis¶

Section 1: Fine-mapping for xQTL and GWAS ¶

Section 2: Multi-context colocalization with Bellenguez 2022 ¶

Section 3: Refinement of colocalized loci with other AD GWAS ¶

Section 4: Assessment of multi-context xQTL effect sizes ¶

Option 1: ColocBoost + MASH¶

Option 2: mvSuSiE¶

Section 5: Multi-context causal TWAS (including conventional TWAS and MR)¶

TWAS results¶

MR results¶

cTWAS results¶

Section 6: Context specific multi-gene fine-mapping ¶

A quick analysis: using the xQTL-AD summary table (flatten table)¶

A statistically solid approach: mvSuSiE multi-gene analysis¶

Section 7: Epigenomic QTL and their target regions ¶

Generate a crude plot to determined whether the story is interesting¶

Section 8: Context focused validation in other xQTL data ¶

Section 9: Non-linear effects of xQTL ¶

APOE interaction¶

Section 10: in silico functional studies in iPSC model ¶

Section 11: Functional annotations of selected loci ¶

Section 12: Candidate loci as trans-xQTL ¶

Creative thinking: generate hypothesis, search in literature, raise questions to discuss¶