基于影像组学特征预测左室射血分数的可行性研究
Radiomics-based left ventricular ejection fraction prediction: a feasibility study
通讯作者: 姜 萌,电子信箱:jiangmeng0919@163.com卜 军,电子信箱:pujun310@hotmail.com。
编委: 崔黎明
收稿日期: 2023-03-23 接受日期: 2023-08-04 网络出版日期: 2023-09-28
基金资助: |
|
Corresponding authors: JIANG Meng, E-mail:jiangmeng0919@163.comPU Jun, E-mail:pujun310@hotmail.com.
Received: 2023-03-23 Accepted: 2023-08-04 Online: 2023-09-28
目的·评估使用心脏磁共振(cardiac magnetic resonance,CMR)短轴电影图像提取的3D影像组学特征用于预测左室射血分数(left ventricular ejection fraction,LVEF)这一方法的可行性。方法·纳入2018年1月至2021年12月期间就诊于上海交通大学医学院附属仁济医院心内科的左室肥厚(left ventricular hypertrophy,LVH)患者共100例,及同时期健康对照(health control,HC)受试者100例,在心内科医师及放射科医师共同监督下完成CMR检查。随后由心内科医师手动勾画心内膜及心外膜并完成对入组人员心功能及形态学的测量与记录,主要包括LVEF、左心室舒张末期容积(left ventricular end-diastolic volume,LVEDV)、左心室舒张末期心肌质量(left ventricular end-diastolic mass,LVEDM)。通过Pyradiomics包提取CMR-cine序列心肌3D影像组学特征并使用相关系数与K-best方法进行特征筛选与排序。构建线性回归(linear regression,LR)、随机森林(random forest,RF)及梯度增强(gradient boost,Gb)3种机器学习回归模型,使用影像组学特征对LVEF进行预测,并与基于临床信息及CMR参数的LVEF预测结果进行比较。结果·在临床指标方面,LVH组与HC组之间LVEDV、LVEDM差异均有统计学意义(P<0.05)。通过提取心肌3D影像组学特征,获得10项特征并用于测试集样本LVEF预测。当所选特征为7项时,RF回归模型获得最佳表现,平均绝对误差(mean absolute error,MAE)为0.066±0.002,显著低于其他2种方法(P<0.001);对于RF回归模型,基于临床信息与舒张末期CMR参数的LVEF预测结果显示,结合影像组学信息与CMR参数的模型(MAE=0.056±0.001)效果最佳,并显著优于单用影像组学(MAE=0.066±0.002)或单用CMR参数(MAE=0.060±0.001)的模型表现(P<0.05)。结论·影像组学特征用于LVEF预测具有一定的可行性,并且将影像组学信息与CMR参数结合,可以进一步提升模型预测准确率。
关键词:
Objective ·To assess the feasibility of using 3D imaging features extracted from cardiac magnetic resonance (CMR) short-axis cine images to predict left ventricular ejection fraction (LVEF). Methods ·A total of 100 left ventricular hypertrophy (LVH) patients who visited the Department of Cardiology, Renji Hospital, Shanghai Jiao Tong University School of Medicine from January 2018 to December 2021, as well as 100 healthy control (HC) subjects during the same period, were included. All subjects completed CMR examinations under the supervision of experienced cardiologists and radiologists. The endocardial and epicardial contours were then manually delineated by cardiologists. Measurements of cardiac function and morphology were completed and data was recorded, including LVEF, left ventricular end-diastolic volume (LVEDV), and left ventricular end-diastolic mass (LVEDM). Myocardial 3D radiomic features of CMR-cine sequences were extracted by the Pyradiomics package, and selected and sorted by using correlation coefficient and K-best method. The LVEF prediction was performed with linear regression (LR), random forest (RF) and gradient boost (GB) methods. Results were also compared with LVEF prediction based on clinical information and CMR parameters. Results ·In terms of clinical indicators, there were significant differences between the LVH and HC groups, such as LVEDV and LVEDM (all P<0.05); after extracting 3D radiomic features, the top 10 features were selected for further analysis. LR regression model, GB regression model and RF regression model were constructed for predicting the LVEF, and RF regression models showed the best results with seven features, in which the mean absolute error (MAE) was 0.066±0.002. Further comparison results showed that the model using radiomic information with CMR parameters (MAE=0.056±0.001) had the best performance and it was significantly better than the model using radiomic features (MAE=0.066±0.002) or CMR parameters (MAE=0.060±0.001) alone (both P<0.05). Conclusion ·The use of radiomic features for LVEF prediction has certain feasibility, and combining radiomic features with CMR parameters can further improve the prediction accuracy of the model.
Keywords:
本文引用格式
刘启明, 卢启帆, 柴烨子, 姜萌, 卜军.
LIU Qiming, LU Qifan, CHAI Yezi, JIANG Meng, PU Jun.
左室射血分数(left ventricular ejection fraction,LVEF)作为评估心功能的一项重要指标,在疾病诊断、患者用药及预后评估等多方面均有重要价值[1-2]。目前获取LVEF的主要方式包括超声心动图(echocardiography,ECG)[3]与心脏磁共振(cardiac magnetic resonance,CMR)[4],其中ECG因高性价比及高普及率目前在临床上最常应用[5],但是基于ECG的LVEF多采用2D图像直接进行计算,结果因操作者熟练度及图像采集习惯等因素,常导致观察者内与观察者间出现一定的差异[6]。CMR作为目前无创心脏形态与功能检查的金标准,虽然普及率较低,但是在评估结果准确性及可重复性方面表现更佳[7]。其他心脏影像学检查,例如胸部CT等虽然仪器配备有心电门控,但采集过程中仍缺少时间轴信息,难以直接计算射血分数;即使部分研究使用了CT电影序列,仍存在放射剂量较高的问题[8]。
如前所述,CMR作为无创心肌形态与功能检查的金标准,在LVEF评估方面较为准确,然而CMR的图像采集往往受到多方面因素的影响。除了常见的运动伪影[13]、卷褶伪影[14]外,收缩期血流速度快导致局部磁场均一性较差的磁敏感伪影在射血分数亢进的患者中也常出现[15]。该血流伪影常集中在收缩期心脏基底层附近(主要由于该处靠近流出道,血流速度较快),而在舒张末期则因为血流速度较为平缓而通常影响较小,图像质量更好[16]。基底段心内膜、心外膜的勾画对LVEF测量的准确性影响也较大。本研究希望基于CMR短轴cine序列舒张末期心肌3D影像组学特征,对心脏整体射血分数进行估算。该研究有望为CMR影像中可能出现的收缩期图像质量差而影响LVEF测量准确性的问题提供新的解决思路[17-18],还有助于从组织形态、纹理特征(熵、能量等)方面理解射血分数与心肌组织间的联系。
1 对象与方法
1.1 研究对象与分组
纳入2018年1月至2021年12月期间就诊于上海交通大学医学院附属仁济医院心内科的LVH患者100例。按照1∶1比例从同时期在该医院完成CMR检查的健康人群数据库(包括临床试验招募的健康志愿者、在心内科就诊时进行了CMR检查但排除相应病史、没有心脏疾病明确诊断的人群)中获取性别、年龄匹配的健康对照(health control,HC)100例。收集LVH患者及HC人群的性别、年龄、身高及体质量等信息。
LVH患者入组标准:超声心动图显示LVH(舒张末期最大室壁厚度>11 mm,男性左室心肌质量指数>115 g/m2或女性左室心肌质量指数>95 g/m2)[19]。LVH患者排除标准:① 年龄<18岁或>70岁。② 明确存在其他系统性疾病造成的心脏累及。③ 纽约心脏病学会(New York Heart Association,NYHA)心功能分级Ⅳ级。④ 存在磁共振禁忌证(妊娠、肾功能不全、幽闭恐惧症)。⑤ 图像质量不佳或采集过程中因呼吸导致的影像错位严重。
HC人群入组标准:既往无心脏相关病史,并且相关检查(心电图、心脏彩超及CMR)均未发现心肌肥厚、心功能异常等表现。
训练组和测试组样本根据训练数据样本数∶测试数据样本数=7∶3的比例进行划分。训练组用于模型训练及参数调整,测试组数据用于结果评估。
1.2 CMR图像采集
磁共振检查均在3.0 T CMR扫描仪(Ingenia,Philips,荷兰)上,由具有3年以上CMR扫描经验的放射科医师完成。图像采集过程中采用呼吸门控及心电门控。Cine序列参数为:采集视野(300~340)mm×(300~340)mm,空间分辨率(0.875~1.000)mm×(0.875~1.000)mm,层厚7 mm,层间距7~10 mm,重复时间3.0 ms,回波时间1.5 ms,反转角45°,1个心动周期内的图像帧数为30。
1.3 图像后处理及资料整理
图像及临床数据经过匿名化处理。图像数据测量由心内科医师在CMR后处理软件Circle Cardiovascular Imaging(版本5.13,加拿大)上完成。测量参数包括LVEF、左心室舒张末期容积(left ventricular end-diastolic volume,LVEDV)和左心室舒张末期质量(left ventricular end-diastolic mass,LVEDM);同时通过临床数据中的体表面积(body surface area,BSA)对LVEDV、LVEDM进行校正,得到左心室舒张末期容积指数(LVEDV/BSA)及左心室舒张末期质量指数(LVEDM/BSA)。
1.4 影像组学特征提取及筛选
影像组学特征筛选:① 计算特征之间的Pearson相关系数(ρ),将ρ>0.8的特征定义为具有高度相似性而移除。② 使用基于互信息的K-best算法筛选最有价值的10项影像组学特征(如果不足10项,则全部进行分析)。
1.5 机器学习模型设计
采用线性回归(linear regression,LR)、随机森林(random forest,RF)及梯度提升(gradient boost,GB)3种回归算法,将影像组学特征输入回归模型进行训练,以实现对LVEF的评估。模型训练采取5折交叉验证法,选择最优模型参数重新在整个训练集数据上训练并获得最终模型。最终模型结果在测试集数据上测试并进行评估。考虑到机器学习模型随机初始化的情况,模型验证过程重复10次。机器学习算法由scikit-learn包(版本1.2.1)完成[22]。
1.6 统计学分析
采用SPSS软件(版本26.0)及python工具(版本3.7.10)进行数据处理及统计学分析。使用Shapiro-Wilk检验进行正态性检验。符合正态分布的定量资料用x±s表示,不符合正态分布的定量资料用M(Q1,Q3)表示。使用独立样本t检验、Mann-Whitney U非参数秩和检验比较2组间差异。定性资料用n(%)表示,采用χ2检验进行比较。机器学习部分交叉验证结果均采用x±s表示。P<0.05表示差异有统计学意义。
2 结果
2.1 LVH患者与HC人群临床信息及CMR参数指标比较
LVH组与HC组人口学资料及CMR参数资料见表1。2组人群在性别、年龄等方面差异均无统计学意义(均P>0.05),LVH组人群体质量较HC组高(P=0.014)。在CMR参数方面,LVH组人群LVEDM、LVEDM/BSA、LVEDV、LVEDV/BSA均较HC组显著升高(均P<0.05)。
表1 LVH组与HC组的临床信息与CMR指标比较
Tab 1
Indicator | Total (n=200) | HC group (n=100) | LVH group (n=100) | P value |
---|---|---|---|---|
Demographic information | ||||
Age/year | 53 (36, 62) | 53 (36, 62) | 53 (36, 63) | 0.562 |
Male/n(%) | 143 (71.5) | 71 (71.0) | 72 (72.0) | 0.876 |
Weight/kg | 72 (63, 80) | 70±14 | 75 (65, 81) | 0.014 |
Height/cm | 170 (163, 175) | 169±10 | 169±8 | 0.793 |
BMI/(kg·m-2) | 24.7 (22.3, 27.1) | 24.2±3.5 | 26.0±4.0 | 0.000 |
BSA/m2 | 1.80±0.22 | 1.77±0.22 | 1.84 (1.70, 1.94) | 0.051 |
CMR parameter | ||||
LVEF/% | 65.1 (59.1, 70.2) | 65.3±7.0 | 65.3 (55.2, 71.0) | 0.336 |
LVEDV/mL | 127.3 (107.1, 158.2) | 125.7±34.7 | 134.8 (117.0, 167.8) | 0.000 |
LVEDV/BSA/(mL·m-2) | 101.7 (80.1, 135.5) | 70.2±14.2 | 75.9 (65.2, 91.8) | 0.000 |
LVEDM/g | 72.2 (62.7, 83.7) | 83.7±24.0 | 134.1 (105.5, 175.6) | 0.000 |
LVEDM/BSA/(g·m-2) | 55.5 (46.7, 71.9) | 46.6±9.6 | 72.0 (59.5, 89.2) | 0.000 |
2.2 影像组学特征提取及筛选情况
通过Pyradiomics包处理后,总共提取了1 316个舒张末期心肌3D影像组学特征,包括形态特征14项、小波特征744项、纹理特征558项。经过Pearson相关系数分析并筛选后,剩余特征99项;通过基于互信息的K-best算法对99项特征进行排序并用前选择前10项于后续分析。
2.3 不同模型使用影像组学特征预测LVEF的效果
表2 不同模型基于7项影像组学特征的LVEF预测表现比较
Tab 2
Model | MAE | P value① |
---|---|---|
LR | 0.075±0.000 | 0.000 |
GB | 0.072±0.000 | 0.000 |
RF | 0.066±0.002 | - |
图1
图1
不同模型基于影像组学特征的LVEF预测散点图
Fig 1
Scatter plots for radiomics-based LVEF predictions with different models
2.4 RF模型中不同类型特征对LVEF的预测结果
前文已明确了在3种算法中,RF算法具有最佳表现,故进一步将RF模型用于临床信息与CMR参数及CMR参数合并影像组学特征的LVEF预测。结果显示,CMR特征结合影像组学信息获得了最佳的预测表现(MAE=0.056±0.001),与其他各组差异具有统计学意义(均P<0.05),结果见表3。
表3 基于临床信息及影像组学的LVEF预测表现
Tab 3
Feature group① | MAE | P value② |
---|---|---|
Basic information③ | 0.071±0.002 | 0.000 |
Radiomics | 0.066±0.002 | 0.000 |
CMR④ | 0.060±0.001 | 0.001 |
CMR+radiomics | 0.056±0.001 | NA |
3 讨论
磁共振相比于其他医学成像方式采集时间较长,因此,在CMR采集过程中不可避免地会遇到患者位置改变、屏气不佳等情况,造成伪影,从而影响图像质量[23]。磁敏感伪影在CMR检查中更是难以避免的一种伪影形式,会在一定程度上影响医师对图像进行手动分割,并对定量参数的获取造成一定的影响。舒张末期及收缩末期图像是基于CMR分析心功能最重要的2个时相,其中舒张末期的图像受到伪影的影响相对较小,因此不论在轮廓勾画还是影像组学特征分析方面都更为合适。
影像组学在近十年来获得了快速的发展,部分原因在于影像组学特征计算具有明确的公式,相比于深度学习方法具有更佳的可解释性[24]。虽然目前关于影像组学特征是否有对应的生物学意义,学界观点并未统一,但是影像组学方法已广泛运用于医学图像处理与分析领域,并在多种任务中获得了良好的表现[25-26]。近年来随着深度学习方法的快速发展及其在心血管领域中的应用[27],深度影像组学方法也在不断被研究与开发,进一步提示影像组学是一项具有潜力的图像分析方法[28]。本研究并未采用基于深度学习的方法用于图像分割的后续影像组学特征提取,原因包括:① 仅使用了舒张末期图像,对于深度学习算法来说,样本量不够大,难以训练大模型并获取较好的分割指标(如dice相似系数)[29]。② 深度学习在小目标(如心尖层)的分割任务中常会出现漏分割的情况,并显著影响3D影像组学特征[30]。③ 部分影像组学特征受图像边缘的影响明显,同时,现有的深度学习分割模型中经常会出现分割边缘参差不齐的情况,容易导致组学特征偏离正常范围[31]。
本研究提出了基于舒张末期心肌3D影像组学预测LVEF的方法。该方法具有以下创新性:① 考虑到心肌收缩舒张运动的影响,舒张末期的图像面积相比收缩期占比更大,图像边缘更锐利更清晰,有利于人工勾画左室心肌区域,有助提升组学特征提取的准确性与可重复性。② 基于3D模态的影像组学特征从整体的角度考虑了心肌的形态、形状等信息,同时避免了使用2D影像组学信息带来的特征量巨大的问题;且不同患者cine图像层数不同,难以设计一个合适的算法整合具有不同层数图像的患者信息。
本研究还比较了不同回归算法之间的表现。LR为解决回归类问题最基本的方法,RF与GB方法均属于集成算法的范畴。集成算法的优势在于继承了多种弱模型的分类结果,较为准确,并且不会产生偏离训练样本数据的预测数据;相比支持向量机算法(support vector machine,SVM)可有效防止出现异常预测值的可能(如预测LVEF>1)。本研究发现LR与GB方法在预测LVEF方面有所欠缺,均未能很好地展示预测值与真实值之间的关系,RF方法相比之下有所提升。对比不同类型的输入信息(临床信息、CMR参数、影像组学特征),本研究结果显示相比于CMR参数,临床基础信息用于估计LVEF的效果较差,该表现也符合临床实践中通常难以从患者的基础状态对心功能进行评估的表现。本研究还证实了CMR参数结合影像组学特征能获得优于各自独立的预测准确性,为影像组学未来用于临床实际中提供了一定的依据。
本研究仍具有一定的局限性:① 仅选择HC与LVH患者2类人群用于模型的训练与验证。如能进一步纳入射血分数明显减退甚至心力衰竭的患者,在多中心、多厂商大数据上进行验证将使本研究有更高的临床应用价值,并且有望拓宽LVEF的分布范围和分布均匀性。② 该方法理论上可推广至胸部CT,从方法学角度为胸部CT没有时序信息进而无法计算LVEF提供了一项可行的参考方案。但受限于本研究未能收集到同批次患者的胸部CT图像资料,未能对该方法的普适性和推广性在多模态影像中进行验证。
综上所述,本研究提出了一个基于舒张末期心肌影像组学特征对LVEF进行预测的方法,并在包含200名对象的队列中进行了验证,展示了影像组学方法用于估计射血分数的可行性。本研究在使用CMR参数和影像组学特征预测LVEF时获得了0.056的MAE表现,验证了影像组学与临床信息结合能提升射血分数估计的准确性。
作者贡献声明
姜萌、卜军和刘启明参与研究设计,刘启明、柴烨子和卢启帆参与数据收集,刘启明负责数据分析,刘启明、柴烨子和卢启帆负责文章撰写和修改。所有作者均阅读并同意了最终稿件的提交。
AUTHOR's CONTRIBUTIONS
JIANG Meng, PU Jun and LIU Qiming participated in research design. LIU Qiming, CHAI Yezi and LU Qifan participated in data collection. LIU Qiming participated in data analysis. LIU Qiming, CHAI Yezi and LU Qifan drafted and revised the manuscript. All the authors have read the last version of paper and consented for submission.
利益冲突声明
本研究不存在利益冲突。
COMPETING INTERESTS
All authors declare no conflict of interest.
参考文献
/
〈 | 〉 |