基于实验室指标的系统性红斑狼疮鉴别诊断列线图的构建及评估
1.
2.
3.
Establishment and evaluation of nomogram for differential diagnosis of systemic lupus erythematosus based on laboratory indications
1.
2.
3.
通讯作者: 于海涛,电子信箱:yuhaitao7707@163.com。
编委: 邢宇洋
收稿日期: 2023-07-05 接受日期: 2023-11-30
基金资助: |
|
Corresponding authors: YU Haitao, E-mail:yuhaitao7707@163.com.
Received: 2023-07-05 Accepted: 2023-11-30
目的·基于实验室指标,建立早期系统性红斑狼疮(systemic lupus erythmatosus,SLE)与其他自身免疫性疾病鉴别诊断的列线图并评估其效能。方法·选择2017年1月—2021年12月在兰州大学第一医院就诊的535例SLE患者(SLE组)以及同时期的535例其他自身免疫性疾病患者(对照组)。收集并比较2组患者的基础信息及实验室检查指标(共116项)。将SLE组和对照组分别按7∶3的比例随机分为训练集和验证集,采用LASSO回归、多因素Logistic回归筛选SLE的主要危险因子,并建立早期SLE鉴别诊断列线图(简称“SLE列线图”)。使用Bootstrap法行内部重复抽样1 000次对列线图进行校准,分别利用受试者操作特征曲线(receiver operator characteristic curve,ROC曲线)、决策曲线分析(decision curve analysis,DCA)评估SLE列线图的鉴别诊断的能力以及在临床应用中的价值。采用R语言“DynNom”包将列线图转换为电子计算器,并通过3组患者数据对其与SLE列线图的一致性进行验证。结果·LASSO回归和多因素Logistic回归共筛选出6个SLE的主要危险因子,即抗核抗体(antinuclear antibody,ANA)、抗双链DNA(anti-double-stranded DNA,anti-dsDNA)抗体、抗核糖核蛋白抗体/史密斯抗体(anti-ribonucleoprotein antibody/anti-Simth antibody,anti-nRNP/Sm)、抗核糖体P蛋白(anti-ribosomal P protein,anti-P)抗体、抗核小体抗体(anti-nucleosome antibody,ANuA)、尿蛋白(urinary protein,PRO),并由该6个因子共同构建SLE列线图。该列线图的校准曲线在训练集和验证集的标准误分别为0.009和0.015,其ROC曲线下面积分别为0.889和0.869。DCA的结果显示,当SLE列线图的风险阈概率在0.15~0.95时,该列线图取得的净获益较高。电子计算器的预测结果显示,1号SLE患者的ANA(滴度1∶100)为阳性,其患病率为0.166;2号患者的ANA(滴度1∶100)、ANuA(滴度1∶100)均为阳性,其患病率为0.676;3号患者的PRO、ANA(滴度1∶100)、ANuA(滴度1∶100)、anti-P抗体(滴度1∶100)均为阳性,其患病率为0.990,这与SLE列线图鉴别诊断的结果相一致。结论·基于ANA、anti-dsDNA抗体、anti-nRNP/Sm、anti-P抗体、ANuA、PRO建立的SLE列线图以及转换成的电子计算器可较好地鉴别SLE早期和其他自身免疫性疾病,具有重要的临床应用价值。
关键词:
Objective ·To establish a nomogram for the differential diagnosis of early systemic lupus erythematosus (SLE) and other autoimmune diseases based on laboratory indications, and to evaluate its efficacy. Methods ·A total of 535 SLE patients admitted to the First Hospital of Lanzhou University from January 2017 to December 2021 were selected as SLE group, and 535 patients with other autoimmune diseases during the same period were selected as control group. Basic information and laboratory test indicators of the SLE group and control group were collected and compared. The SLE group and control group were randomly assigned to the training set and the validation set at a ratio of 7∶3, respectively. LASSO regression method and multivariate Logistic regression were used to select the main risk factors of SLE. The nomogram for differential diagnosis of early SLE (SLE nomogram) was established according to the selected main risk factors. Bootstrap method was used to conduct internal repeated sampling for 1 000 times to calibrate the nomogram. The receiver operator characteristic curve (ROC curve) and decision curve analysis (DCA) were performed to evaluate the differential diagnosis ability and the value in clinical application of SLE nomogram, respectively. The "DynNom" package of R language was used to convert the nomogram into an electronic calculator, and its consistency with SLE nomogram was verified by data from 3 groups of patients. Results ·LASSO regression and multivariate Logistic regression identified six major risk factors for SLE, including antinuclear antibody (ANA), anti-double-stranded DNA (anti-dsDNA) antibody, anti-ribonucleoprotein antibody/anti-Simth antibody (anti-nRNP/Sm), anti-ribosomal P protein (anti-P) antibody, anti-nucleosome antibody (ANuA) and urinary protein (PRO), which were used to construct the SLE nomogram. The calibration curve of the SLE nomogram had standard errors of 0.009 and 0.015 in the training set and validation set, respectively, and its area under the curve (AUC) was 0.889 and 0.869, respectively. The results of DCA showed that when the risk threshold of SLE nomogram was 0.15‒0.95, the model achieved more net benefit. The prediction results of the electronic calculator showed that when ANA (titer 1∶100) was positive in SLE patient No.1, the prevalence was 0.166; when both ANA (titer 1∶100) and ANuA (titer 1∶100) were positive in patient No.2, the prevalence was 0.676; when all of PRO, ANA (titer 1∶100), ANuA (titer 1∶100) and anti-P antibody (titer 1∶100) were positive in patient No.3, the prevalence was 0.990, which was consistent with the differential diagnosis results of the SLE nomogram. Conclusion ·The established SLE nomogram based on ANA, anti-dsDNA antibody, anti-nRNP/Sm, anti-P antibody, ANuA and PRO and its conversion into an electronic calculator can effectively distinguish early SLE from other autoimmune diseases, and have important clinical application value.
Keywords:
本文引用格式
杨婧偊, 陈留宝, 王康太, 杨兴智, 于海涛.
YANG Jingyu, CHEN Liubao, WANG Kangtai, YANG Xingzhi, YU Haitao.
系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种复杂的自身免疫性疾病,也是临床常见的疑难杂症。该疾病常表现为高异质性,多出现单一症状或不典型症状,可造成全身多系统、多器官损伤。同时,早期SLE易被误诊为与其临床表现、实验室指标相近的其他自身免疫性疾病,从而影响早期SLE的准确诊断。如:SLE患者表现出的发热、疲倦、乏力、体质量下降、食欲缺乏、肌肉疼痛等症状可在大部分自身免疫性疾病患者中出现;SLE累及骨骼肌导致的晨僵、关节痛、关节炎、关节畸形等症状与类风湿性关节炎的症状相似[1];部分SLE患者继发性口干、眼干、腮腺肿大等易与干燥综合征的症状混淆[2-3];个别SLE患者以肝损害为突出或首发表现,易与自身免疫性肝炎患者的症状混淆[4-5];部分SLE患者以腹泻、腹痛等为首发症状,易与克罗恩病患者的症状混淆[6];此外,作为诊断SLE的重要实验室指标,抗核抗体(antinuclear antibody,ANA)等自身抗体的阳性结果也常见于其他自身免疫性疾病,最终影响SLE与其他自身免疫疾病的鉴别诊断[7-10]。因此,有必要建立一种鉴别早期SLE与其他自身免疫性疾病的新方法,从而提高对早期SLE的鉴别诊断能力。
1 对象与方法
1.1 研究对象及其分组
1.2 患者资料收集及比较、数据预处理
收集并比较2组患者的基本信息、实验室指标等资料(共计116项),包括年龄、性别及入院首次检测的114项实验室指标。
1.3 SLE列线图的构建与评估
1.4 SLE列线图的电子计算器转换及验证
使用R语言“DynNom”包将SLE列线图转换为电子计算器,即通过输入患者的主要危险因子即可计算出其患SLE的概率。而后,随机选用SLE组2例患者、对照组1例患者,分别采用电子计算器、SLE列线图根据其主要危险因子计算其患SLE的概率,并对计算结果进行比对。
1.5 统计学分析
使用R Studio软件4.1.2版本进行数据处理和分析。符合正态分布的定量资料用x±s表示,采用t检验进行分析;不符合正态分布的定量资料以M(Q1,Q3)表示,采用Mann-Whitney U检验进行分析。定性资料以频率(百分率)表示,采用χ2检验进行分析。使用LASSO回归筛选与SLE相关的因子。采用多因素Logistic回归模型对筛选出的相关因子进行分析。所有统计检验均为双尾检验,P<0.05表示差异具有统计学意义。
2 结果
2.1 与SLE相关的主要危险因子筛选
采用K-S检验对训练集、验证集患者的116项资料的分布进行分析,结果显示训练集和验证集的患者在116项资料间差异均无统计学意义,即资料的分布在训练集和验证集间不存在偏差。随后,对SLE组和对照组患者的114项实验室指标进行分析,结果发现有79项指标的组间差异具有统计学意义(均P<0.05);与对照组比较,其中有52项指标在SLE组患者中较高,27项指标在SLE组患者中较低。使用LASSO回归算法对79项差异指标进一步分析,参数λ值选取0.099 5[log(λ)=-2.307 7],共筛选出9个SLE相关因子(图1A、B)。随后,采用多因素Logistic回归模型对该9个因子行进一步分析,筛选条件为OR>1.5且P<0.05,结果(图1C)显示尿蛋白(urinary protein,PRO)、抗双链DNA(anti-double-stranded DNA,anti-dsDNA,滴度为1∶10)抗体、抗核糖核蛋白抗体/史密斯抗体(anti-ribonucleoprotein antibody/anti-Simth antibody,anti-nRNP/Sm,滴度为1∶100)、抗核小体抗体(anti-nucleosome antibody,ANuA,滴度为1∶100)、抗核糖体P蛋白(anti-ribosomal P protein,anti-P,滴度为1∶100)抗体、ANA(滴度为1∶100)为SLE的主要危险因子。同时,该6个因子在训练集和验证集中的分布情况见表1。
图1
图1
与SLE相关的主要危险因子筛选
Note: A. LASSO coefficient curves for 79 indicators according to log(λ). The colored lines represent the influence of λ value in the model on the weight coefficients of different indicators. The dashed line represents the best λ value and its number of indicators. B. Selection of the indicators by LASSO at the optimal parameter (λ). C. Multivariate Logistic regression analysis of major risk indicators. TP—total protein; Pos—positive; Neg—negative.
Fig 1
Selection of major risk indicators related to SLE
表1 训练集和验证集患者的6项SLE主要危险因子比较
Tab 1
Risk factor | Training set (n=758) | Validation set (n=312) | P value | ||
---|---|---|---|---|---|
SLE group | Control group | SLE group | Control group | ||
PRO | |||||
Pos | 227 (29.95) | 81 (10.69) | 87 (27.88) | 30 (9.62) | 0.999 |
Neg | 152 (20.05) | 298 (39.31) | 69 (22.12) | 126 (40.38) | |
Anti-dsDNA antibody (titer 1∶10) | |||||
Pos | 157 (20.71) | 10 (1.32) | 61 (19.55) | 5 (1.60) | 1.000 |
Neg | 222 (29.29) | 369 (48.68) | 95 (30.45) | 151 (48.40) | |
Anti-nRNP/Sm (titer 1∶100) | |||||
Pos | 179 (23.61) | 20 (2.64) | 51 (16.35) | 10 (3.21) | 0.274 |
Neg | 200 (26.39) | 359 (47.36) | 105 (33.65) | 146 (46.79) | |
ANA (titer 1∶100) | |||||
Pos | 342 (45.12) | 252(33.25) | 143 (45.83) | 108 (34.62) | 1.000 |
Neg | 37 (4.88) | 127 (16.75) | 13 (4.17) | 48 (15.38) | |
ANuA (titer 1∶100) | |||||
Pos | 128 (16.89) | 4 (0.53) | 52 (16.67) | 0 (0) | 1.000 |
Neg | 251 (33.11) | 375 (49.47) | 104 (33.33) | 156 (50.00) | |
Anti-P antibody (titer 1∶100) | |||||
Pos | 102 (13.46) | 6 (0.79) | 35 (11.22) | 2 (0.64) | 0.999 |
Neg | 277 (36.54) | 373 (49.21) | 121 (38.78) | 154 (49.36) |
2.2 SLE列线图的建立
利用上述获得的6个主要危险因子建立SLE列线图(图2)。根据列线图中各个指标对SLE鉴别诊断的贡献,我们给每个因子的取值水平进行赋分,再将各分值相加获得总评分,最后通过总评分与SLE患病风险之间的函数转换关系计算个体发生SLE的概率。
图2
本研究中,该6个主要危险因子的评分由高到低依次为anti-P抗体(滴度1∶100)阳性100分、anti-nRNP/Sm(滴度1∶100)阳性99.56分、ANuA(滴度1∶100)阳性97.24分、anti-dsDNA抗体(滴度1∶10)阳性80.80分、PRO阳性59.64分、ANA(滴度1∶100)阳性21.97分。通过各个因子结果可计算患者总分,计算公式为:Total points=anti-P antibody×100+anti-nRNP/Sm×99.56+ANuA×97.24+anti-dsDNA antibody×80.80+PRO×59.64+ANA×21.97。而后,将患者总分与列线图中的患病风险对应,分析获得SLE患病概率。如,当患者的ANuA、PRO、ANA这3项为阳性,列线图总分为178.85分时,患者发生SLE的风险为90%。
2.3 SLE列线图的校准与评价
采用Bootstrap法对列线图中的训练集和验证集进行校准,结果(图3A、B)显示校准曲线在训练集和验证集的标准误分别为0.009和0.015;提示该校准曲线与理想曲线拟合良好,说明预测值和实际观察值符合度高。采用ROC曲线分别计算训练集、验证集的AUC,结果(图3C)显示训练集和验证集的AUC分别为0.889和0.869(均大于0.85),提示该列线图具有较好的鉴别诊断SLE与其他自身免疫性疾病的能力。使用DCA评估列线图鉴别诊断SLE风险的净获益,结果(图3D)显示,风险阈概率在0.15~0.95之间时提示使用该列线图可取得更多的净获益;即当风险阈概率在上述区间时,与干预所有患者方案或不干预患者方案相比,使用该列线图预测风险并合理干预患者是非常有益的,且净获益越高则临床获益越大。
图3
图3
SLE列线图鉴别诊断的性能验证
Note: A. Calibration curve of the training set. B. Calibration curve of the validation set. C. ROC curve of the training set and validation set. D. DCA curve of the training set.
Fig 3
Performance verification of nomogram for differential diagnosis of SLE
2.4 SLE列线图的电子计算器转换和验证
将上述已建立的SLE列线图转换为电子计算器,通过向其中输入患者的6个危险因子的检查结果来计算其SLE的患病率。为验证该电子计算器计算SLE患病率的准确性,我们使用电子计算器、列线图手动法同时对3位患者(2例SLE患者和1例对照组患者)进行患病率预测。结果(图4)显示,1号患者ANA(1∶100)为阳性,其余5项主要危险因子结果为阴性,电子计算器的结果显示其患病率为0.166,列线图手动计算得出该患者的SLE患病概率为0.1~0.3;2号患者ANA(1∶100)、ANuA(1∶100)为阳性,其余4项结果均为阴性,电子计算器的结果显示其患病率为0.676,列线图手动计算其SLE患病概率为0.5~0.7;3号患者PRO、ANA(1∶100)、ANuA(1∶100)、anti-P抗体(1∶100)为阳性,其余2项结果为阴性,电子计算器的结果显示其患病率为0.990,列线图手动计算其SLE患病概率>0.9。上述结果表明,电子计算器可准确、直接地显示患者早期SLE的患病概率。
图4
图4
SLE鉴别诊断的电子计算器
Note: A. Patient data input interface. B. Patient risk output interface.
Fig 4
Electronic calculator for differential diagnosis of SLE
3 讨论
本研究发现血清ANuA、anti-P抗体、anti-nRNP/Sm、anti-dsDNA抗体、PRO、ANA是SLE的主要危险因子,这与前人的报道一致。有研究[23]发现SLE患者的ANuA阳性率约为56%,且该指标阳性与狼疮疾病活动度、狼疮肾炎呈正相关。Anti-P抗体存在于多种自身免疫性疾病中,与狼疮患者肾脏损伤、活动期嗅觉功能障碍有一定相关性[24-25]。anti-nRNP/Sm在SLE患者中的阳性率约为50%,联合该抗体与抗核抗体谱中的其他抗体对SLE的诊断意义更大[26]。Anti-dsDNA抗体在SLE诊断中具有特异性较高、灵敏度较低的特点,联合该抗体及其他指标可提高SLE疾病诊断率[27];且最近的研究[28]表明,anti-dsDNA抗体与狼疮肾炎的发生和发展显著相关。ANA是诊断SLE的高敏感性指标[29],临床上常以ANA滴度≥1∶80阳性作为考虑为SLE的首要条件,但ANA阳性并不意味着狼疮的确诊。单独使用上述6种实验室指标在SLE的诊断和鉴别诊断中尚具有一定的局限性,因此多项指标联合应用可有效填补单一指标在诊断上的不足,提高SLE的鉴别诊断能力。
目前,SLE的诊断和鉴别诊断主要根据2019年欧洲抗风湿病联盟联合美国风湿病学会共同发布的系统性红斑狼疮分类标准(2019 European League Against Rheumatism/American College of Rheumatology Systemic Lupus Erythematosus Classification Criteria,2019 EULAR/ACR criteria),并通过其中的症状和实验室指标进行诊断。该标准是由ANA以及21种症状和体征组成的积分表,在ANA滴度≥1∶80、总评分≥10分且排除其他可能的诊断后即可被确诊为SLE。由于该标准涉及的内容较多,临床上使用较为烦琐;而早期SLE症状缺乏特异性,且其与其他自身免疫性疾病间存在相似的体征,这又为早期SLE的鉴别诊断带来了困难。在本研究中,我们根据SLE主要危险因子的作用权重建立了SLE列线图,可通过患者的实验室检查结果直接计算出其患病风险;这不仅为临床工作提供了便利,还可较好地实现早期SLE与其他自身免疫性疾病的鉴别诊断,解决了早期SLE的漏诊和误诊问题。本研究通过LASSO和多因素Logistic回归筛选出SLE的6项主要危险因子,并由该6项建立了早期SLE鉴别诊断的列线图。该列线图在训练集和验证集的AUC分别为0.889和0.869,提示该列线图可较好地鉴别早期SLE和其他自身免疫性疾病,即具有良好的鉴别诊断能力。而后,我们将列线图转换成电子计算器,以更加方便、快捷地评估SLE的患病率,从而为进一步实现临床转化应用奠定了基础。
本研究尚存在一定的局限性:①为单中心研究且纳入的SLE组、对照组患者数量不足,可能会造成纳入研究对象的偏倚,从而限制了该列线图的可扩展性以及鉴别早期SLE和其他自身免疫性疾病的效能。②未纳入患者的临床症状指标,使得SLE列线图无法评价、筛选、鉴别早期SLE和其他自身免疫性疾病的关键临床症状。③转换的电子计算器尚不能实现联网使用。未来,我们将开展多中心研究,纳入更多的临床样本以及患者临床症状等资料,进一步优化、验证SLE列线图,并将电子计算器开发为简易的软件,以辅助临床医师进行早期诊断。
综上所述,基于实验室指标ANuA(滴度1∶100)阳性、anti-P抗体(滴度1∶100)阳性、anti-nRNP/Sm(滴度1∶100)阳性、anti-dsDNA抗体(滴度1∶10)阳性、PRO阳性、ANA(滴度1∶100)阳性建立的SLE列线图以及转换成的电子计算器可较好地鉴别早期SLE和其他自身免疫性疾病,具有潜在临床应用价值。后续我们会将该模型整合入初级保健软件,通过向其中输入症状和实验室指标结果来标记具有发病风险的患者,以辅助临床医师进行早期诊断、干预,特别是在社区医院和医疗资源分布不均匀的偏远地区医院,从而改善患者预后、提高其生存质量。
作者贡献声明
于海涛参与试验设计,于海涛、杨婧偊参与论文的撰写和修改、数据分析,杨婧偊、陈留宝、王康太、杨兴智参与数据收集和整理。所有作者均阅读并同意了最终稿件的提交。
AUTHOR's CONTRIBUTIONS
The study was designed by YU Haitao. The manuscript was drafted and revised by YU Haitao and YANG Jingyu. The data were analyzed by YU Haitao and YANG Jingyu. The data were collected and organized by YANG Jingyu, CHEN Liubao, WANG Kangtai and YANG Xingzhi. All the authors have read the last version of paper and consented for submission.
利益冲突声明
所有作者声明不存在利益冲突。
COMPETING INTERESTS
All authors disclose no relevant conflict of interests.
参考文献
/
〈 |
|
〉 |
