心脏磁共振短轴电影成像影像组学鉴别肥厚型心肌病与健康对照
Short-axis cine cardiac magnetic resonance images-derived radiomics for hypertrophic cardiomyopathy and healthy control classification
通讯作者: 姜 萌,电子信箱:jiangmeng0919@163.com卜 军,电子信箱:pujun310@hotmail.com。
编委: 包玲
收稿日期: 2023-03-21 接受日期: 2023-09-06
基金资助: |
|
Corresponding authors: JIANG Meng, E-mail:jiangmeng0919@163.comPU Jun, E-mail:pujun310@hotmail.com.
Received: 2023-03-21 Accepted: 2023-09-06
目的·分析肥厚型心肌病(hypertrophic cardiomyopathy,HCM)患者与健康对照人群的心脏磁共振(cardiac magnetic resonance,CMR)短轴电影(cine)成像影像组学特征差异,并对2类人群进行分类。方法·纳入2018年1月—2021年12月就诊于上海交通大学医学院附属仁济医院心内科的HCM患者100例,以2∶1比例随机选取同时期健康对照(healthy control,HC)50例,在放射科医师规范操作下完成CMR检查。通过CVI 42后处理软件完成对入组人员左心室心功能及形态学的测量与评估,主要包括左心室射血分数(left ventricular ejection fraction,LVEF)、舒张末期左心室容积(left ventricular end-diastolic volume,LVEDV)和舒张末期左心室心肌质量(left ventricular end-diastolic mass,LVEDM)。并从CMR短轴电影成像中获取舒张末期心肌区域3D影像组学特征。分析影像组学特征在2类人群中的分布,并构建机器学习模型对2类人群进行分类。结果·共提取3D影像组学特征107个。在排除高度一致的特征后采用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)模型进行5折交叉验证后,仍有11个系数非0的特征;利用K-best方法选择排序靠前的8个用于后续建模分析,其中4个特征在2组人群中差异具有统计学意义(均P<0.05)。随后构建支持向量机(support vector machine,SVM)和随机森林(random forest,RF)模型用于判别2类人群。结果显示:单一特征模型(一阶:熵)最大曲线下面积(area under the curve,AUC)为0.833(95%CI 0.695~0.968);多特征模型(SVM算法)最高准确率为83.3%,其对应的AUC为0.882(95%CI 0.705~0.980)。结论·HCM患者与HC人群在左心室功能和左心室形态上均有显著差异,同时3D心肌影像组学特征也有显著差异。尽管单一特征模型可以鉴别2类人群,但联合多特征构建的模型有更好的分类效果。
关键词:
Objective ·To analyze the differences and classify hypertrophic cardiomyopathy (HCM) patients and healthy controls (HC) using short-axis cine cardiac magnetic resonance (CMR) images-derived radiomics features. Methods ·One hundred HCM subjects were included, and fifty HC were randomly selected at 2∶1 ratio during January 2018 to December 2021 in the Department of Cardiology, Renji Hospital, Shanghai Jiao Tong University School of Medicine. The CMR examinations were performed by experienced radiologists on these subjects. CVI 42 post-processing software was used to obtain left ventricular morphology and function measurements, including left ventricular ejection fraction (LVEF), left ventricular end-diastolic volume (LVEDV) and left ventricular end-diastolic mass (LVEDM). The 3D radiomic features of the end-diastolic myocardial region were extracted from short-axis images CMR cine. The distribution of the radiomic features in the two groups was analysed and machine learning models were constructed to classify the two groups. Results ·One hundred and seven 3D radiomic features were selected and extracted. After exclusion of highly correlated features, least absolute shrinkage and selection operator (LASSO) was used, and a 5-fold cross-validation was performed. There were still 11 characteristics with non-zero coefficients. The K-best method was used to decide the top 8 features for subsequent analysis. Among them, four features were significantly different between the two groups (all P<0.05). Support vector machine (SVM) and random forest (RF) models were constructed to discriminate the two groups. The results showed that the maximum area under the curve (AUC) for the single-feature model (first order grayscale: entropy) was 0.833 (95%CI 0.685‒0.968) and the maximum accuracy for the multi-feature model was 83.3% with an AUC of 0.882 (95%CI 0.705‒0.980). Conclusion ·There are significant differences in both left ventricular function and left ventricular morphology between HCM and HC. The 3D myocardial radiomic features of the two groups are also significantly different. Although single feature is able to distinguish the two groups, the combination of multi-features show better classification performance.
Keywords:
本文引用格式
刘启明, 卢启帆, 柴烨子, 姜萌, 卜军.
LIU Qiming, LU Qifan, CHAI Yezi, JIANG Meng, PU Jun.
心脏磁共振(cardiac magnetic resonance,CMR)具有高时间分辨率、高空间分辨率等特点,是目前无创评估心脏形态及功能的金标准[4-5]。然而,部分HCM患者无特异性临床表现,且心肌肥厚的影像学表现易与高血压性心脏病混淆等特点,导致该病的影像学检查有一定的漏诊或误诊风险[6-7]。并且在心尖肥厚型HCM中,心肌肥厚的位置较为局限,因此也容易被忽略[8]。既往相关研究常聚焦于数种心肌肥厚相关疾病的鉴别,包括HCM、高血压心肌肥厚、心肌淀粉样变等[7,9-10],也有关于HCM与健康对照的临床参数比较[11],但是较少直接用影像组学方法尝试鉴别HCM与健康对照。使用该方法鉴别HCM与健康对照,对于理解2种疾病影像组学特征分布与形态学改变的关系有一定的价值[12]。
本研究试图从CMR成像的影像组学特征出发,探究此特征分布在这2类人群中是否有差异,同时建立基于3D影像组学的机器学习模型,对2类人群的图像进行判别。既往使用3D组学特征的研究较少,且大多针对CMR功能序列(T1加权序列)[13-15]。相较既往基于T1的研究,本研究所采用的电影(cine)成像相较于功能序列往往有更高的空间分辨率,在层间距方面也更具优势。同时,虽然CMR技术目前正在逐步普及[16],但是T1、T2等功能序列的图像采集往往差异较大,短轴电影序列则是检查的必备项目,且采集技术与操作者稳定性更佳,因此也使得该技术具有较好的可推广性与可重复性。因此,本研究拟提取并比较上述2类人群CMR短轴电影成像的定量影像组学特征,并利用该特征结合机器学习算法对2类人群进行分类,旨在从影像组学角度探究2组人群影像特征的差异。
1 对象与方法
1.1 研究对象及分组
纳入2018年1月—2021年12月就诊于上海交通大学医学院附属仁济医院心内科HCM患者100例,并以2∶1比例随机选取同时期健康对照(healthy control,HC)50例。HCM患者纳入标准:① 基因检测明确HCM相关基因[如MYBPC3(myosin binding protein C3)、TNNT2(troponin T2,cardiac type)等]突变患者。② 左心室肥厚(舒张末期最大室壁厚度>15 mm,对于有家族史的患者要求此厚度>13 mm)。③ 部分特殊类型HCM(如心尖型HCM)。排除标准:① 年龄<18岁或>70岁。② 合并其他心脏疾病或其他系统性疾病造成的心脏累及。③ 纽约心脏病学会(New York Heart Association,NYHA)心力衰竭程度分级Ⅳ级。④ 磁共振检查禁忌证(妊娠、肾功能不全、幽闭恐惧症等)。⑤ 图像质量不佳或图像序列缺失。
HC纳入标准:年龄18~75岁,既往无心脏相关病史,相关检查(心电图、心脏彩色超声及CMR)均未发现心肌肥厚或心功能异常等表现。
入组人群根据训练数据∶测试数据=4∶1进行随机划分。训练数据(n=120)用于后续训练及内部验证,测试数据(n=30)用于结果评估。
1.2 CMR采集
所有研究对象于同一台3.0T CMR扫描仪(Ingenia,Philips,荷兰)上完成检查。放射科图像采集医师均具有3年以上CMR扫描经验。图像采集过程中采用呼吸门控及心电门控。短轴电影序列参数:采集视野(300~340)mm×(300~340)mm;空间分辨率(0.875~1.000)mm×(0.875~1.000)mm;层厚7 mm,层间距7~10 mm,重复时间3.0 ms;回波时间1.5 ms,翻转角45°,一个心动周期内图像帧数30。
1.3 人口学资料收集、图像处理及资料整理
在受试者完善CMR检查前收集其性别、年龄、身高及体质量等数据。人口学资料及图像首先经过匿名化处理。为减少观察者间差异,后续测量由2名具有3年以上CMR分析经验的心内科医师达成一致后完成[17]。所有的图像数据测量均在CMR后处理软件CVI42(版本5.13,加拿大)上完成。测量参数包括左心室射血分数(left ventricular ejection fraction,LVEF)、舒张末期左心室容积(left ventricular end-diastolic volume,LVEDV)和舒张末期左心室心肌质量(left ventricular end-diastolic mass,LVEDM);同时通过临床数据中的身高与体质量信息完善体表面积(body surface area,BSA)计算,并使用BSA对LVEDV和LVEDM进行校正,得到LVEDV指数(LVEDV index=LVEDV/BSA)及LVEDM指数(LVEDM index=LVEDM/BSA)。
1.4 影像组学特征提取及筛选
影像组学图像预处理:① 图像均经过重采样(resampling)至1.0 mm×1.0 mm×1.0 mm体素大小以满足3D影像组学的空间各向同性。② 图像灰度值标准化至0~255。③ 灰度值离散化至带宽(binwidth)为16。本研究仅提取了原始图像影像组学,未对图像进行滤波等处理。本研究中,特征提取使用Pyradiomics软件包进行操作[18]。
影像组学特征筛选:① 计算特征之间的Pearson相关系数(r),r>0.8的特征被定义为具有高度相似性,因此被移除。② 采用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)回归模型,在训练数据中使用5折交叉验证法,以均方误差(mean square error,MSE)最小值为目标函数筛选有价值的特征。③ 使用K-best方法筛选最有价值的8项影像组学特征(如果不足8项,则全部进行分析)。
1.5 机器学习模型设计
1.6 统计学分析
采用SPSS 26.0及Python 3.7.10软件进行数据处理及统计分析。正态分布的定量资料采用x±s表示,使用t检验完成组间比较;非正态分布的定量资料采用M(Q1,Q3)表示,组间比较采用Mann-Whitney U非参数秩和检验。P<0.05表示差异具有统计学意义。
2 结果
2.1 2 组人群人口学资料及CMR参数比较
如表1所示,2组人群在性别、年龄等方面差异均无统计学意义,但是HC组人群身高较HCM组高(P=0.002)。在CMR参数方面,HCM组人群LVEF、LVEDM、LVEDM指数均比HC组高,而LVEDV则比HC组低,差异具有统计学意义(均P<0.05)。
表1 2组人群人口学资料与CMR参数比较
Tab 1
Indicator | Total (n=150) | HCM (n=100) | HC (n=50) | P value |
---|---|---|---|---|
Age/year | 51 (39, 60) | 52 (43, 60) | 46 (36, 61) | 0.408 |
Male/n(%) | 110 (73) | 71 (71) | 39 (78) | 0.362 |
Weight/kg | 71.2±13.1 | 70.5±12.8 | 72.7±13.7 | 0.671 |
Height/cm | 170 (162, 175) | 170 (160, 173) | 173 (166, 180) | 0.002 |
BMI/(kg·m‒2) | 24.2 (22.4, 26.6) | 24.5 (22.5, 26.8) | 23.9 (22.3, 25.3) | 0.253 |
BSA/m2 | 1.79±0.21 | 1.77±0.20 | 1.83±0.22 | 0.419 |
CMR parameter | ||||
LVEF/% | 66.3±7.1 | 67.1±7.8 | 64.6±5.0 | 0.019 |
LVEDV/mL | 132.4±32.3 | 132.3±29.0 | 132.7±38.4 | 0.035 |
LVEDV index/(mL·m‒2) | 72.3±31.7 | 75.0±15.4 | 71.8±15.6 | 0.876 |
LVEDM/g | 114.0 (90.9, 158.4) | 137.1 (104.8, 178.0) | 90.4 (68.7, 103.5) | 0.000 |
LVEDM index/(g·m‒2) | 62.7 (49.9, 88.1) | 77.8 (59.3, 99.0) | 47.4 (42.4, 55.1) | 0.000 |
2.2 影像组学特征提取及筛选
表2 测试集HCM组与HC组左心室心肌3D影像组学特征比较
Tab 2
Feature class and name | HCM | HC | P value |
---|---|---|---|
GLDM: large dependence high gray level emphasis | 34 779.60 | 23 528.60 | 0.047 |
First-order grayscale: kurtosis | 5.92 | 5.05 | 0.116 |
First-order grayscale: entropy | 4.03 | 4.38 | 0.004 |
GLSZM: zone entropy | 7.76 | 7.67 | 0.037 |
GLCM: correlation | 0.86 | 0.84 | 0.077 |
First-order grayscale: 90th percentile | 129.70 | 174.60 | 0.054 |
Shape: major axis length | 94.00 | 88.20 | 0.037 |
Shape: least axis length | 75.10 | 72.50 | 0.322 |
图1
图1
LASSO回归用于特征筛选时的表现图
Note: A shows that MSE reached minimum with λ=0.005 336 699. B shows that when MSE reached minimum, 11 features had non-zero coefficient.
Fig 1
Performance of LASSO regression on feature selection
2.3 影像组学特征在HCM与HC间的差异
图2
图2
训练集及测试集上3D影像组学特征的 Z 分数分布箱线图
Note: Boxplot on the left side showed the distribution of feature values in training dataset. Boxplot on the right side showed the distribution of feature values in testing dataset.
Fig 2
Boxplots of Z-score for 3D radiomic features in training and testing datasets
2.4 机器学习方法基于单一影像组学特征的HCM与HC判别
使用SVM方法获得最佳曲线下面积(area under the curve,AUC)的单一特征为熵(一阶特征),AUC为0.833(95%CI 0.695~0.968);使用RF方法获得最佳AUC的单一特征为最短轴长度(形状特征),AUC为0.810(95%CI 0.625~0.912)。基于单一特征的判别模型表现如表3所示。
表3 基于3D影像组学单一特征判别模型的测试集表现
Tab 3
Feature class and name | AUC (95%CI) | |
---|---|---|
SVM | RF | |
GLDM: large dependence high gray level emphasis | 0.758 (0.520‒0.863) | 0.668 (0.486‒0.825) |
First-order grayscale: kurtosis | 0.726 (0.517‒0.866) | 0.623 (0.445‒0.803) |
First-order grayscale: entropy | 0.833 (0.695‒0.968) | 0.679 (0.435‒0.782) |
GLSZM: zone entropy | 0.712 (0.365‒0.801) | 0.648 (0.449‒0.836) |
GLCM: correlation | 0.707 (0.507‒0.857) | 0.667 (0.511‒0.845) |
First-order grayscale: 90th percentile | 0.752 (0.544‒0.910) | 0.697 (0.446‒0.801) |
Shape: major axis length | 0.673 (0.282‒0.735) | 0.554 (0.323‒0.677) |
Shape: least axis length | 0.680 (0.318‒0.740) | 0.810 (0.625‒0.912) |
2.5 机器学习方法基于多影像组学特征的HCM与HC判别
图3
图3
HCM与HC组多特征判别模型表现折线图
Fig 3
Line plot for multi-feature-based HCM and HC classification performance
表4 基于3D影像组学多特征判别模型的测试集表现
Tab 4
Feature number | Model | Accuracy/% | AUC | P for accuracy | P for AUC |
---|---|---|---|---|---|
2 | SVM | 66.7±0 | 0.756±0 | 0.000 | 0.000 |
RF | 60.7±4.1 | 0.729±0.20 | |||
4 | SVM | 70.0±0 | 0.776±0 | 0.000 | 0.000 |
RF | 61.7±2.4 | 0.740±0.22 | |||
6 | SVM | 80.0±0 | 0.871±0.03 | 0.080 | 0.043 |
RF | 76.0±6.8 | 0.847±0.35 | |||
8 | SVM | 83.3±0 | 0.882±0.05 | 0.005 | 0.022 |
RF | 77.7±5.7 | 0.868±0.18 |
3 讨论
本研究分析了HCM与健康对照的CMR参数和影像组学特征,并发现影像组学特征相比于CMR参数,能更好地区分2类人群。近年来随着CMR检查的逐渐普及,CMR相关研究呈上升趋势,基于CMR的HCM相关研究也随之增多。NEISIUS等[7]通过分析HCM、高血压性心脏病及HC人群的CMR纵向弛豫时间定量成像(T1 mapping)技术的影像组学,发现左心室肥厚(HCM+高血压性心脏病)患者的2D影像组学特征与HC有显著性差异。YU等[22]在超声领域也开展了类似的研究并获得了相近的结果。然而,这些研究主要仍是基于2D图像的特征,从而损失了部分空间信息。对于心脏超声研究,这个问题同样存在,同时由于心脏彩色超声采集医师的不同,更容易引起观察者间差异。基于CMR电影成像的3D影像组学则同时克服了以上2个难点:在图像采集方面,CMR电影成像更加规范,且临床可拓展性和普及性较高;同时通过重采样方法,可以将解剖结构整体的3D信息一起纳入考虑,利用模型能学习更宏观的信息,对整体结构和图像特征进行更为准确的判别。
本研究首先通过人口学资料和CMR参数对HCM及HC人群进行了比较。结果显示,与HC相比,HCM患者在左心结构及左心功能上均有明显改变,由于肥厚导致LVEDM及LVEDM指数显著增加,同时HCM患者常有射血功能亢进表现,这也体现在HCM组人群LVEF较HC组显著增加这一表现上。
本研究进一步提取基于CMR短轴电影成像的3D心肌影像组学特征。通过对特征进行分析,发现在形态、一阶灰度及纹理方面均有显著差异的特征,与临床观察结果也具有一致性。再进一步将组学特征用于HCM与HC人群判别进行建模测试。本研究选择SVM和RF 2种算法主要考虑了以下几点:① 线性回归方法过于简单。② XGBoost等新的算法机制较为复杂,对于小样本常存在较明显的过拟合倾向。本研究中总样本仅为150例,故未选用。③RF及SVM这2种算法有较长的发展历史与完善的理论基础,并在机器学习领域有广泛应用。在确定了模型之后,通过试验发现单一特征中熵(一阶)对判别2种疾病的图像最有价值。除了对单一组学特征进行模型构建,本研究还构建了多特征判别模型。多特征模型提示了以下信息:① 随着特征数的增加,模型表现持续提升。在所选的特征数量范围内,模型的拟合及测试集上的泛化能力未见饱和。② SVM方法相较RF方法具有更高的准确率。③ 多特征模型在表现上相较于单特征模型有所提升。综合上述结果提示,HCM与HC人群的CMR影像差异可以通过影像组学结合机器学习模型进行判别。
关于影像组学特征提取方面,我们考虑了以下几点,并决定仅提取原始图像的组学特征:① 本研究样本量为150例,如果对图像进行滤波处理并提取特征,特征数往往超过103个,将远超样本数,容易导致模型过拟合现象的发生,影响模型的泛化能力[26]。② 采用原始图像提取的影像组学特征具有更佳的可解释性。以单一特征效果最好的熵为例,可以将其理解为灰度值分布随机性的一种表现形式;结合HCM与HC心肌的形态差异,HCM患者常有不对称性肥厚发生,对于特征的表述与灰度值的分布及变化相关联,对潜在的临床应用和辅助理解有一定的帮助。
本研究仍存在一定的局限性。① 样本量较少,只有150例入组人员,在一定程度上限制了我们选择用于分析的影像组学特征的数量。② 未进行外部验证,无法验证模型在外部数据上的泛化能力。③ 关于影像组学的研究,距离真正的临床转化应用还有一定距离,并且机器学习内部的工作原理与高维数据分布对模型表现的影响难以进一步定量分析与可视化展示。
综上所述,本研究通过分析3D影像组学在HCM与HC人群中的分布及差异,构建了基于3D影像组学的机器学习判别方法。该算法具有快速、计算代价低、可解释性佳等特点。未来可整合进临床图像处理系统,将有助于辅助早期HCM患者的筛查。
作者贡献声明
姜萌、卜军参与研究设计,刘启明、柴烨子与卢启帆参与数据收集,刘启明负责数据分析,刘启明、柴烨子、卢启帆负责文章撰写。
AUTHOR's CONTRIBUTIONS
JIANG Meng and PU Jun participated in research plan. LIU Qiming, CHAI Yezi and LU Qifan participated in data collection. LIU Qiming was in charge of data analysis. LIU Qiming, CHAI Yezi and LU Qifan participated in manuscript drafting.
利益冲突声明
所有作者声明不存在利益冲突。
COMPETING INTERESTS
All authors declare no conflict of interest.
参考文献
/
〈 | 〉 |