上海交通大学学报(医学版) ›› 2019, Vol. 39 ›› Issue (10): 1156-.doi: 10.3969/j.issn.1674-8115.2019.10.009
桑 潮1,谢国祥2,梁丹丹1,赵爱华1,贾 伟1, 2,陈天璐1
SANG Chao1, XIE Guo-xiang2, LIANG Dan-dan1, ZHAO Ai-hua1, JIA Wei1, 2, CHEN Tian-lu1
摘要: 目的·采用约登指数改进肝纤维化诊断模型的性能,解决组间样本数相差大时诊断灵敏度不平衡的问题。方法·使用在GitHub网站公开获取的来自上海中医药大学附属曙光医院的482例乙型肝炎病毒(hepatitis B virus,HBV)感染患者和来自厦门市中医院的86例HBV感染患者分别作为训练集和验证集开展研究。基于HBV患者的年龄和3项血液学检查结果(血小板计数、血清中谷草转氨酶和谷丙转氨酶含量),建立线性判别分析、随机森林、梯度增强、决策树4种机器学习模型,实现早期和晚期肝纤维化的诊断,以及肝纤维化和肝硬化的诊断。借助约登指数调整模型的分类阈值和诊断结果。采用总准确率、受试者工作特征曲线下面积(area under the curve,AUC)和灵敏度等指标,比较各模型以及临床常用的基于4个因素的纤维化指数(fibrosis index based on the 4 factor,FIB-4)的诊断性能。结果·在肝纤维化诊断中,4种机器学习模型均存在组间灵敏度不平衡的现象。在向模型引入约登指数后,组间灵敏度的差别均大幅减小;机器学习模型的总准确率和AUC普遍高于FIB-4。结论·基于约登指数的诊断模型可平衡各组间的灵敏度,有助于提高肝纤维化诊断模型的综合性能。
中图分类号: