两样本孟德尔随机化法分析1型糖尿病对结直肠癌的影响
Analysis of impact of type 1 diabetes on colorectal cancer by using two-sample Mendelian randomization
通讯作者: 朱莹杰,电子信箱:lh2197@shutcm.edu.cn。
编委: 瞿麟平
收稿日期: 2024-01-06 接受日期: 2024-02-28 网络出版日期: 2024-06-11
基金资助: |
|
Corresponding authors: ZHU Yingjie, E-mail:lh2197@shutcm.edu.cn.
Received: 2024-01-06 Accepted: 2024-02-28 Online: 2024-06-11
目的·利用孟德尔随机化法(Mendelian randomization,MR)研究1型糖尿病与结直肠癌间潜在的因果关系。方法·采用两样本双向MR分析评估1型糖尿病与结直肠癌的因果关系。研究数据均来自IEU Open GWAS Project数据库。1型糖尿病的数据集包括患者9 266例和对照人群15 574例,包含12 783 129个单核苷酸多态性(single nucleotide polymorphism,SNP)的关联分析;结直肠癌的数据集包括患者5 657例和对照人群372 016例,包含29 999 696个SNP的关联分析。筛选工具变量SNP,以逆方差加权(inverse variance weighted,IVW)法结果作为效应的主要指标,同时将MR-Egger回归、加权中位数法、基于众数的简单估计、基于众数的加权估计4种方法结果作为参考。采用留一法检验敏感性,采用IVW法和MR-Egger法进行Cochran's Q检验判断异质性,MR-pleiotropy函数检验多效性,采用Steiger检验进行方向性研究。采用共定位分析评估1型糖尿病和结直肠癌之间的效应是否由相同的SNP引起,采用交叉性状连锁不平衡得分回归(linkage disequilibrium score regression,LDSC)分析2种疾病之间的遗传相关性。所有检验采用R语言软件(4.3.1版本)执行分析。结果·经筛选后,共采用工具变量(SNP)33个。异质性检验结果发现,SNP之间存在一定的异质性(IVW法和MR-Egger法结果均P<0.05),因此效应评估采用随机效应模型的结果。正向MR分析结果显示,IVW法、MR-Egger法、加权中位数法、基于众数的加权估计均发现1型糖尿病对结直肠癌存在显著的因果效应(均P<0.05);敏感性分析显示,结果稳定。多效性检验未检测到多效性(P>0.05)。Steiger检验发现,1型糖尿病对结直肠癌的效应未受反向作用干扰。反向MR分析未发现结直肠癌对1型糖尿病存在因果效应(均P>0.05)。共定位分析结果显示,H4假设概率为45.7%,2种疾病间的因果关系不是由两者基因序列中相同的SNP引起的。LDSC分析显示2种疾病不存在遗传相关性。结论·1型糖尿病可能促进结直肠癌发生,但结直肠癌对1型糖尿病不存在影响。
关键词:
Objective ·To investigate the potential causal relationship between type 1 diabetes and colorectal cancer by using Mendelian randomization (MR). Methods ·Two-sample bidirectional MR was used to investigate the causal relationship between type 1 diabetes and colorectal cancer. All research data were collected from the IEU Open GWAS Project database. The dataset of type 1 diabetes included 9 266 cases and 15 574 controls, with correlation analysis in 12 783 129 single nucleotide polymorphisms (SNPs); the dataset of colorectal cancer included 5 657 cases and 372 016 controls, with correlation analysis in 29 999 696 SNPs. The instrumental variables SNPs were screened. The results derived from the inverse-variance weighted (IVW) method were used as the main indicator of effect. The results derived from other four methods, namely MR-Egger regression, weighted median, simple mode, and weighted mode, were used as reference. Sensitivity was analyzed with the leave-one-out method. Heterogeneity was analyzed with Cochran's Q test by using both IVW and MR-Egger methods. Pleiotropy was analyzed with MR-pleiotropy function, and Steiger test was used for directional research. The colocation analysis was used to find out whether the causal relationship between type 1 diabetes and colorectal cancer was caused by the same SNP. The genetic correlation between 2 diseases was analyzed by using the linkage disequilibrium score regression (LDSC). All tests were analyzed by using R language software (version 4.3.1). Results ·After being screened, a total of 33 instrumental variables (SNPs) were used. The heterogeneity test results showed that there was heterogeneity among the SNPs (IVW and MR-Egger: P<0.05), so the effect evaluation was based on the results of the random effect model. MR analysis showed that type 1 diabetes had a significant causal effect on colorectal cancer (P<0.05) by using IVW, MR-Egger, weighted median and weighted mode. Sensitivity analysis showed that the results were stable. Pleiotropy was not detected in pleiotropy test (P>0.05). Steiger test showed that the effect of type 1 diabetes on colorectal cancer was not interfered with by the reverse effect. Reverse MR analysis showed no causal effect of colorectal cancer on type 1 diabetes (P>0.05). The results of colocalization analysis showed that the probability of H4 hypothesis was 45.7%, and the causal relationship between the 2 diseases was not caused by the same SNP in the gene sequences. LDSC analysis demonstrated that there was no genetic correlation between the two diseases. Conclusion ·Type 1 diabetes may promote colorectal cancer, but colorectal cancer has no effect on type 1 diabetes.
Keywords:
本文引用格式
俞洋, 孟丹, 仇奕文, 袁见, 朱莹杰.
YU Yang, MENG Dan, QIU Yiwen, YUAN Jian, ZHU Yingjie.
1型糖尿病(type 1 diabetes)是由自身免疫系统异常引起胰岛β细胞功能损伤,导致胰岛素生成减少而形成的糖尿病[1]。该病好发于婴儿、儿童和青少年,因此又称青少年糖尿病。近年来,我国的1型糖尿病逐渐呈现低龄化趋势[2]。结直肠癌(colorectal cancer)是一种胃肠道恶性肿瘤,好发于中老年,我国的结直肠癌新发病例和死亡人数均位列世界第一[3]。结直肠癌与2型糖尿病具有较强的相关性[4],结直肠癌多见于2型糖尿病患者。但1型糖尿病起病于青少年,其对结直肠癌的影响如何,研究较少。孟德尔随机化(Mendelian randomization,MR)是一种基于全基因组关联研究(genome-wide association study,GWAS)的数据,它的核心是利用与暴露因素具有强相关的遗传单核苷酸多态性(single nucleotide polymorphism,SNP)变异作为工具变量,研究外界暴露或者是一种疾病与另一种疾病的相关性,或者分析生物遗传相关性的流行病学方法。本研究拟采用MR探究1型糖尿病与结直肠癌之间的生物学关系。
1 资料与方法
1.1 实验设计与资料来源
本研究遵循MR研究规范化报告[5]进行相关分析。研究流程包括一个单变量两样本正向MR分析(1型糖尿病-结直肠癌),以及一个反向MR分析(结直肠癌-1型糖尿病),从而探索1型糖尿病与结直肠癌的关系。本研究所采用的数据均来自IEU Open GWAS Project数据库(
1型糖尿病的生物遗传数据来自FORGETTA等[6]于2020年发表的大规模meta分析在线数据集(GWAS ID:ebi-a-GCST010681);该数据集提供了不限性别的24 840例欧洲人群的全基因组分析数据,包括患者9 266例和对照人群15 574例,包含12 783 129个SNP的关联分析。
结直肠癌数据来自2021年发表于英国生物银行(UK Biobank)的大规模meta分析在线数据集(GWAS ID:ieu-b-4965);该数据集提供了不限性别的377 673例欧洲人群的全基因组分析数据,包括患者5 657例和对照人群372 016例,包含29 999 696个SNP的关联分析。
1.2 工具变量的选择
MR分析依赖于三大假设:①工具变量与暴露因素密切相关。②工具变量与混杂因素无关。③工具变量仅通过暴露而非其他途径影响结局[7]。正向MR分析时,根据上述原则,设置P<5×10-8以保证假设①成立,并通过去除连锁不平衡(r2<0.001,遗传距离>10 000 kb[8-9])以满足假设②和③的条件。将上述去除连锁不平衡后获得的SNP,采用R语言软件(4.3.1版本,
为了评估结直肠癌是否对1型糖尿病具有因果效应,反向MR分析将结直肠癌设置为暴露,1型糖尿病设置为结局,工具变量的选择、数据分析的参数设置与正向MR分析相同。
1.3 数据分析
1.3.1 效应估计
采用逆方差加权(inverse variance weighted,IVW)法作为主要的因果效应估计方法[12]。为证实MR分析主要结果的可靠性和稳定性,将另外4种方法作为参考,分别为MR-Egger回归[13]、加权中位数法(weighted median)[14]、基于众数的简单估计(simple mode)[15]、基于众数的加权估计(weighted mode)[15]。采用R语言软件(4.3.1版本)的TwoSampleMR包(
1.3.2 敏感性、异质性、多效性、方向性分析
采用留一法(leave-one-out)法对研究结果进行敏感性分析[12]。该方法逐步剔除各SNP,计算剩余SNP的合并效应,并观察依次删除各SNP后剩余的SNP合并效应对结果的影响,评估各SNP分析结果的稳定性。采用Cochran's Q检验中的IVW法和MR-Egger法对研究结果进行异质性分析,计算Q值和P值。若P<0.05,提示结果存在异质性,则采用随机效应模型;若P≥0.05,提示结果不存在异质性,则采用固定效应模型。采用MR-pleiotropy函数评估多效性[12],分别计算截距和P值,截距越接近0表示多效性水平越低,P>0.05提示不存在基因多效性。采用Steiger检验进行方向性研究,以辅助判断方向,拒绝由反向因果关系引起的偏差[16]。以上分析均采用R语言软件(4.3.1版本)的TwoSampleMR包(
1.3.3 共定位分析
采用R语言软件(4.3.1版本)的coloc包(
1.3.4 交叉性状连锁不平衡得分回归分析
为评估1型糖尿病和结直肠癌间是否共享多基因结构,进行交叉性状连锁不平衡得分回归(linkage disequilibrium score regression,LDSC)分析。计算遗传相关性(genetic correlation),即当2个GWAS有重叠个体时,会出现遗传基因相关性,可能导致偏倚的存在,而LDSC会为遗传相关性提供一个更为准确的无偏倚的估计[18]。采用R语言软件(4.3.1版本)的LDSC包(
2 结果
2.1 正向MR分析
工具变量筛选后,本研究共采用工具变量(SNP)33个,均通过了F值检测(F≥10),无与结局相关混淆因素的SNP存在。
异质性研究的Cochran's Q检验检测到SNP之间存在一定的异质性(IVW法:Q=52.58,P=0.012;MR-Egger法:Q=46.55,P=0.036)。因此,效应评估采用随机效应模型的结果。IVW法的效应评估结果发现,1型糖尿病对结直肠癌存在影响(P=0.003 4);其他4种方法中,MR-Egger法(P=0.001 3)、加权中位数法(P=3.39×10-5)、基于众数的加权估计(P=0.000 1)均发现1型糖尿病对结直肠癌影响有统计学意义,仅基于众数的简单估计(P=0.671 9)未发现统计学意义。综上,5种方法中4种方法,包括主要的IVW法,结果均有统计学意义,因此判断1型糖尿病对结直肠癌存在因果效应(表1)。
表1 5种MR方法检验1型糖尿病对结直肠癌的效应
Tab 1
Exposure | Outcome | MR method | P value | OR (95%CI) |
---|---|---|---|---|
Type 1 diabetes | Colorectal cancer | IVW | 0.003 4 | 1.000 7 (1.000 2‒1.001 1) |
MR-Egger | 0.001 3 | 1.001 1 (1.000 5‒1.001 8) | ||
Weighted median | 3.39×10-5 | 1.001 0 (1.000 5‒1.001 4) | ||
Simple mode | 0.671 9 | 1.000 3 (0.998 8‒1.001 9) | ||
Weighted mode | 0.000 1 | 1.001 0 (1.000 6‒1.001 4) |
在SNP效果的散点图(图1)中,IVW法、MR-Egger法、加权中位数法、基于众数的加权估计、基于众数的简单估计5种方法的回归斜率方向一致,随着暴露因素1型糖尿病的患病率增加,结直肠癌的患病率更高,为正相关。
图1
图1
SNP对1型糖尿病和结直肠癌效应的散点图
Fig 1
Scatterplot of SNP effects on type 1 diabetes and colorectal cancer
森林图(图2)显示,MR-Egger法和IVW法均证实1型糖尿病对结直肠癌存在因果效应。
图2
图2
1型糖尿病对结直肠癌效应森林图
Fig 2
Forest plot of effect of type 1 diabetes on colorectal cancer
2.2 正向MR分析的敏感性、异质性、多效性、方向性分析
敏感性分析显示:在剔除任何单个SNP后,结果均>0(图3),说明本研究结果稳定;当删除任何单个SNP时,剩余SNP合并的因果效应仍然稳定。
图3
图3
1型糖尿病对结直肠癌效应的敏感性分析(留一法)
Fig 3
Sensitivity analysis for effect of type 1 diabetes on colorectal cancer(leave-one-out analysis)
MR-pleiotropy函数检验多效性检验发现,其截距与0极为接近(截距=-0.000 3),未检测到有水平多效性存在(P=0.054 0)。
漏斗图(图4)中,采用IVW法和MR-Egger法分别进行计算,发现两侧点的分布大致对称,未检测到未平衡的水平多效性。
图4
图4
1型糖尿病对结直肠癌效应的漏斗图
Fig 4
Funnel plot of effect of type 1 diabetes on colorectal cancer
Steiger检验发现,1型糖尿病对结直肠癌的方向性判断为“TRUE”,P<0.000 1,说明结果未受反向作用干扰。
2.3 反向MR分析
反向MR分析结果(表2)发现,5种方法结果P值均>0.05,因此判断结直肠癌对1型糖尿病不存在因果效应。
表2 5种MR方法检验结直肠癌对1型糖尿病的效应
Tab 2
Exposure | Outcome | MR method | P value | OR (95%CI) |
---|---|---|---|---|
Colorectal cancer | Type 1 diabetes | IVW | 0.373 2 | 0.013 8 (1.12×10-6‒171.093 6) |
MR-Egger | 0.643 6 | 0.000 3 (3.23×10-18‒2.96×10-10) | ||
Weighted median | 0.273 9 | 0.000 8 (2.34×10-9‒279.941 3) | ||
Simple mode | 0.247 1 | 3.36×10-6 (1.82×10-14‒745.124 1) | ||
Weighted mode | 0.266 8 | 4.42×10-5 (4.18×10-12‒426.783 2) |
2.4 共定位分析
共定位分析结果显示,2种疾病的H4假设概率仅为45.7%,低于80%的阈值,因此结直肠癌与1型糖尿病之间的因果效应不是由两者基因序列中相同的SNP引起的。
2.5 LDSC分析
结直肠癌与1型糖尿病之间的遗传相似度,遗传相关性(Rg)=-0.001 6,遗传相关性的标准误为0.119 7(P=0.989 3)。因此,结直肠癌与1型糖尿病之间不存在遗传相关性。
3 讨论
本研究基于IEU数据库公开的大规模GWAS汇总数据,进行两样本双向MR分析。MR分析的基本机制认为,等位基因随机分配给配子,利用基因的稳定性及孟德尔第一和第二遗传定律,通过随机分配的基因型对表型的影响来推断生物学因素对疾病的影响,在大规模数据中该方法可以起到类似于临床实验的效果[19]。
研究[20]证实,2型糖尿病是结肠发生癌变和淋巴结转移的可能影响因素。另一研究[21]中,患有2型糖尿病的结直肠癌患者与没有糖尿病的患者组比较,在病理分期、淋巴结转移、肝脏转移等方面存在明显差异,2型糖尿病是结直肠癌恶性程度增加的重要风险因素。甚至另有研究[22]显示复方中药葛根芩连汤可以对结直肠癌与2型糖尿病实现异病同治。与2型糖尿病类似,1型糖尿病与结直肠癌也存在一些共同的危险因素。首先是高糖摄入。JOH等[23]研究表明,青少年时期长期摄入含糖饮料或高糖食物,会增加罹患结直肠肿瘤的风险。青少年在13~18岁期间,含糖饮料每日摄入量每增加1份(1份相当于354.84 mL),早发性结直肠癌的风险就会增加约32%[24]。一项前瞻性的饮食调查[25]发现,高糖饮料的摄入可改变胰岛自身免疫反应,促进1型糖尿病发展,高糖饮料的摄入对1型糖尿病高遗传风险的儿童危害更大。同时,肠道微生物与1型糖尿病和结直肠癌之间均密切相关。1型糖尿病多伴随肠道微生态失调,而肠道微生态失调则会改变肠道微环境,诱导癌变的发生[26]。葡萄糖调节蛋白78(glucose-regulated protein 78,GRP78)对调节内质网应激引起的未折叠蛋白反应至关重要,这个蛋白在1型糖尿病及结直肠癌的病理进程中均发挥了重要作用[27]。本研究采用的数种MR分析方法结果均提示,1型糖尿病是结直肠癌的危险因素。
本研究具有一定的优势。本研究的正向MR和反向MR分析说明,1型糖尿病促进结直肠癌的发生发展,但结直肠癌对1型糖尿病无作用。本研究也对工具变量进行了严格的限制和挑选,排除了弱工具变量偏倚,排除了回文结构SNP,排除了混淆因素相关的SNP。但本研究也存在一定的局限性。统计学结果中,正向MR研究P值均小于0.05,可OR值均略大于1,差异并不明显,原因是可能存在目前未知的混杂因素,但留一法结果稳定,因此即使混杂因素存在,对本实验主要结果影响也较小。总体而言,对本MR研究结果的解读仍需谨慎,后续需要进一步的研究,特别是大型临床研究或流行病学研究的支持。在人群选择上,由于亚洲人群1型糖尿病和结直肠癌基因GWAS数据的缺乏,本研究只能在欧洲人群中进行,后续如有亚洲人群的相关GWAS数据发表,将开展在亚洲人群中的相关性分析以进行补充。
综上所述,本研究利用遗传数据进行两样本双向MR分析,证实1型糖尿病对结直肠癌存在因果效应,1型糖尿病促进了结直肠癌的发生和发展,反之结直肠癌对1型糖尿病无因果效应。明确1型糖尿病与结直肠癌之间的因果关系,有助于结直肠癌的精准防控:加强1型糖尿病患者结直肠癌的健康教育和定期筛查,以及早期干预,可能对控制结直肠癌的患病率有积极的意义。
AUTHOR's CONTRIBUTIONS
ZHU Yingjie designed this research. YU Yang, MENG Dan, QIU Yiwen and YUAN Jian participated in data collection and analysis. This article was written by YU Yang, and reviewed and revised by ZHU Yingjie. All authors have read the last version of paper and approved submission.
作者贡献声明
朱莹杰负责研究设计;俞洋、孟丹、仇奕文、袁见参与数据收集和分析;俞洋负责撰写论文;朱莹杰负责审阅并修改。所有作者均阅读并同意了最终稿件的提交。
利益冲突声明
所有作者声明不存在利益冲突。
COMPETING INTERESTS
All authors disclose no relevant conflict of interests.
参考文献
/
〈 | 〉 |