第7章 放射组学:技术背景(Radiomics: Technical Background)
作者
- Bettina Baessler, MD(通讯作者)— Institute of Diagnostic and Interventional Radiology, University Hospital Würzburg, Germany;同时挂职 University Hospital Zurich, Switzerland. 本书心脏放射组学的核心代表——Ch 12(患者选择)、Ch 28(心脏瓣膜)、Ch 31(心脏 CT 放射组学)的合著者。
本章是Part I 的"放射组学技术"专章——把 Ch 6 的"现代深度学习"扩展到"传统手工特征 + 经典 ML"的另一条 AI 路径。读者应理解 Ch 2 提到的"经典 ML vs 深度学习"的分歧。
内容概述
本章是放射组学(radiomics)的方法学综述——定义为"图像 = 数据",从医学图像的像素/体素灰度分布中提取人工设计的、定量的、可重复的特征,然后用经典 ML 建立诊断/预后模型。核心论点:(1) 放射组学是 "高维手工特征 + 经典 ML" 的范式,与 Ch 6 的"端到端深度学习"是互补而非替代;(2) 完整工作流是6 步链:图像采集 → 分割 → 图像处理 → 特征提取 → 统计分析 → 预测建模;(3) 图像处理是放射组学的最大变数来源——像素间距重采样、灰度离散化、归一化、滤波等设置稍有不同,特征值就显著变化。IBSI(Image Biomarker Standardization Initiative, Zwanenburg 2016, 2020)是事实标准;(4) 特征分四大家族:① 形状(shape),② 强度直方图(intensity/histogram),③ 纹理(texture)——核心,包括 GLCM、GLRLM、GLSZM、GLDZM、NGTDM、NGLDM 六大矩阵,④ 基于模型(model-based)的纹理;(5) 心脏放射组学自 2017 年后论文数指数增长(2016 年 1 篇 → 2020 年 14 篇),应用包括心梗、肥厚型心肌病、心肌炎等。本章是 Ch 12、Ch 28、Ch 31 的方法学基础。
核心方程与概念
0. 几个量化表达
- 灰度级数:\(b\) 位图像灰度范围 \([0, 2^b - 1]\)。CT 通常 12 bit(0-4095),MRI 12 bit,普通 X 线 8 bit(0-255)。
- IBSI 标准化特征数:截至 2020 年,IBSI 文档定义了170+ 标准化放射组学特征的计算公式——所有严肃的放射组学研究应使用 IBSI 命名。
- 直方图统计:均值 \(\mu = \frac{1}{N}\sum_i x_i\),方差 \(\sigma^2 = \frac{1}{N}\sum_i (x_i - \mu)^2\),偏度(skewness)\(\gamma_1 = \frac{\frac{1}{N}\sum_i (x_i - \mu)^3}{\sigma^3}\),峰度(kurtosis)\(\gamma_2 = \frac{\frac{1}{N}\sum_i (x_i - \mu)^4}{\sigma^4} - 3\)。
- 图像处理流程(IBIS 推荐):interpolation → re-segmentation → intensity outlier filtering → discretization(binning)。
1. 放射组学工作流(6 步)
- 图像采集 → 分割 → 图像处理 → 特征提取 → 数据分析 → 预测建模
- 最关键的环节是"图像处理"——同一组数据,不同的 binning 选择可让特征值变化 30%+。
2. 图像分割(Image Segmentation)
- ROI/VOI 定义:手动 / 半自动 / 全自动。心脏影像中常用整个心肌作为 VOI。
- 观察者间偏差:手动分割受阅片者影响——必须在数据分析中报告。
3. 图像处理(Image Processing)—— 关键步骤
- 插值到各向同性像素间距(isotropic voxel spacing)——大多数纹理特征旋转不变性的前提。
- 范围重分割(Range Re-segmentation):去除 ROI 内的灰度异常值(如 CT/PET 可设定 [-1000, 400] HU)。MRI 因强度单位无意义 → 用 intensity outlier filtering。
- 强度离群值过滤:去除 ROI 内的极端灰度值。
- 灰度离散化(Binning / Discretization):把连续灰度分组为有限 bin(常用 32、64、128、256 bins)。核心参数:bin 宽度、bin 数量、bin 起始值。特征值对 bin 数量极其敏感。
- 滤波:可对小波、高斯、Laplacian 等滤波后的图像再提取特征——增加特征维度。
- IBSI 标准(Zwanenburg 2016, 2020)—— 所有设置应报告并遵守。
4. 四大家族放射组学特征
4.1 形状特征(Shape Features)
- 几何描述:面积、体积、致密度(compactness)、球形度(sphericity)。
- 应用:肿瘤形态("毛刺状" → 侵袭性)。在心脏影像中目前应用极少——通常整个心肌作为 VOI,形态意义不大。
4.2 强度直方图特征(Intensity/Histogram Features)
- 基本统计:均值、方差、偏度、峰度、中位数、min/max、百分位数(10th, 90th)、IQR、范围、变异系数、能量、RMS。
- 强度-体积直方图(IVH)特征:VOI 在不同强度阈值上的体积分数——评估"增强程度"等。
4.3 纹理特征(Texture Features)—— 核心
核心思想:纹理特征量化像素/体素灰度的空间分布关系,反映组织同质性/异质性。例:纤维化心肌异质性高,纹理特征"高";正常心肌均匀,纹理特征"低"。
- GLCM(Grey-Level Co-occurrence Matrix, 灰度共生矩阵):"二阶直方图"——统计"在某方向上相距 \(d\) 的两个像素,灰度分别为 \(i\) 和 \(j\) 的概率"。2D 中 8 个方向,3D 中 26 个方向。从 GLCM 提取约 25 个特征(对比度、相关性、能量、熵等)。
- GLRLM(Grey-Level Run Length Matrix, 灰度游程矩阵):统计"灰度 \(i\) 连续出现 \(j\) 次"的长度——衡量同质性。约 16 个特征。
- GLSZM(Grey-Level Size Zone Matrix, 灰度区域大小矩阵):统计"灰度 \(i\) 的连通区域大小为 \(j\) 的数量"——衡量异质性。
- GLDZM(Grey-Level Distance Zone Matrix):灰度区域 + 距离信息。
- NGTDM(Neighbourhood Grey Tone Difference Matrix):每个像素与其邻域的灰度差——衡量粗糙度。
- NGLDM(Neighbouring Grey-Level Dependence Matrix):统计"中心像素灰度为 \(i\)、邻域灰度为 \(j\)"的频次。
- 核心应用:心肌梗死(Baessler 2018)、肥厚型心肌病、急性心肌炎(Baessler 2018, 2019)的纹理分析能提供LVEF 等常规指标之外的诊断价值。
4.4 基于模型的特征(Model-based Features)
- 分形分析(fractal analysis):用分形维数(fractal dimension)量化"自相似性"。
- 基于 Markov 随机场的纹理。
5. 特征选择与降维
- 特征数 vs 样本数:放射组学常提取 100-1000+ 特征,但样本量常 < 500 → 维度灾难。
- 降维方法:LASSO(\(L_1\) 正则化)、主成分分析(PCA)、互信息、最小冗余最大相关(mRMR)。
- 经典 ML 模型:Logistic 回归、随机森林、SVM、Boosting(XGBoost, LightGBM)。深度学习本身也可做特征学习——这是与 Ch 6 DL 的桥梁。
6. IBSI 标准化(Image Biomarker Standardization Initiative)
- Zwanenburg 等 2016, 2020 发布的国际共识。
- 目标:让不同软件提取的"同一种特征"计算结果一致。
- 核心要求:报告所有图像处理参数(像素间距、bin 宽度、bin 数量等)。
关键结论
- 放射组学 ≠ 深度学习——它是"高维手工特征 + 经典 ML"的独立范式。在数据有限、领域知识强、需要可解释的场景中有优势。
- 图像处理是变数的最大来源——bin 数量、像素间距、归一化方案的微小变化就能让"重现性"破坏。这是放射组学被批评的核心理由。
- IBSI 标准化是质量基准——任何严肃的放射组学研究必须报告 IBSI 合规的参数。
- 纹理特征是心脏放射组学的核心——心肌纤维化、浸润、水肿的"不可见"异质性,纹理特征能捕捉到。
- 形状特征在心脏中价值有限——VOI 通常是整个心肌,形态变化不显著。
- 特征维数远大于样本数——必须做降维(LASSO/PCA/mRMR),否则过拟合。
- 心脏放射组学是新兴领域——2016 年 1 篇论文 → 2020 年 14 篇 → 预计未来 5-10 年指数增长。
- 放射组学 + 深度学习的融合("deep radiomics")正在发生——用 CNN 自动学习特征,再做经典 ML 分类。
挑战和开放性问题
- 重现性危机——同一数据,不同软件(Pyradiomics vs LIFEx vs IBEX)的特征值不一致。IBSI 旨在解决,但行业采纳缓慢。
- 扫描仪/协议敏感——同一患者在 GE vs Siemens 扫描,纹理特征值显著不同。多中心泛化是最大挑战。
- 观察者间分割变差——手动分割的 Dice 在不同观察者间 0.7-0.85,意味着特征值随分割变化 20-30%。自动化分割(Ch 6 的 U-Net)是出路但引入新偏倚。
- 维度灾难——500 特征 + 200 样本 = 几乎必然过拟合。降维方法选择影响最终模型。
- "特征组合" 的多重比较问题——100 个特征 + 1000 次检验 → 即使无信号也会出现"显著"结果。必须做多重检验校正(Bonferroni, FDR)。
- P 值的"p-hacking"风险——放射组学论文常选择性报告"有显著意义的特征" → 发表偏倚严重。预注册 + 大样本验证是出路。
- IBSI 标准与深度学习特征的兼容性——深度学习提取的特征(如 CNN 倒数第二层)无法被 IBSI 直接标准化——"深度放射组学"是新范式但缺标准。
- 心脏放射组学的临床应用仍少——多数研究停留在"诊断 vs 正常"的二分类,临床决策支持需要更细的预后/治疗反应预测。
- 与深度学习"端到端"对比——在大型数据集上 DL 通常优于放射组学,但在 < 500 样本小数据集上放射组学仍有优势(手工特征不易过拟合)。
个人反思与批判性分析
本章是放射组学领域最完整的方法学综述之一,是 Baessler 团队的心脏放射组学研究基础。但仍值得反思:
优势: - 工作流 6 步图清晰可作为项目启动清单。 - 图像处理的"4 个环节"(插值、范围重分割、离群值过滤、离散化)一一解释。 - 四大家族特征的明确分类和 IBSI 命名规范。 - GLCM 的 26 个方向(3D)、GLRLM 的"同质性"度量等细节——是其他教材少见的"深度"内容。 - 心脏放射组学的具体应用(心肌梗死、肥厚型心肌病、心肌炎)有引用支撑。 - IBSI 标准化作为事实标准反复强调。
批判与补足: 1. 缺少"深度学习与放射组学对比" 的实证基准——同一数据集上 CNN 端到端 vs 放射组学+经典 ML 的性能差距是多少?没有统一的 ImageNet 时刻——放射组学 + XGBoost 在很多任务上仍可与 CNN 媲美。 2. 缺"深度放射组学"(Deep Radiomics)——用 CNN 自动学习特征,再做经典 ML 分类——这是 2018 年以来的新趋势(Hosny 2018, Lao 2017)。本章完全没提。 3. 缺"特征稳定性"分析——ICC(intraclass correlation coefficient)评估同一患者不同次扫描的特征稳定性,是放射组学的关键质量指标。建议在每项研究前做 ICC 筛选。 4. 缺"临床决策曲线分析"(Decision Curve Analysis, Vickers 2006)——放射组学模型的临床效用最终要看"在不同阈值概率下净获益",而不只是 AUC。 5. 缺"校准度"评估——放射组学模型常有过拟合的"高 AUC",但校准度(Hosmer-Lemeshow 检验、校准曲线)常被忽视。AUC 高 ≠ 临床有用。 6. IBSI 标准对 LaTeX 写作时如何引用没提——按 IBSI 命名重命名所有特征是体力活。 7. "心脏放射组学 vs 心脏深度学习"的真实战场未明——Ch 31(心脏 CT 放射组学)vs Ch 33(CMR 深度学习)有重叠。读者应同时读两章理解两种范式的优劣。 8. 缺"开源工具"的具体推荐——PyRadiomics(van Griethuysen 2017)、LIFEx、IBEX、CERR 是常用工具。本章未提。PyRadiomics 是 IBSI 兼容的 Python 库,是事实标准。 9. 缺"小样本统计推断"的现代方法——放射组学样本量 100-500 是常态,传统 t 检验不适用。置换检验(permutation test)、自助法(bootstrap) 才是出路。 10. 缺"放射组学 + 病理组学(pathomics)+ 基因组学" 的多组学融合——这是"精准医疗"的真正前沿(部分在 Ch 8 涉及)。
给作者的问题: - 在 2022 年这个时间点,放射组学 vs 端到端深度学习,你的选择是基于什么?数据量 <500 时放射组学是否仍占优? - 心脏放射组学的临床应用(vs 论文发表)你见过哪些真正的"医生在用"案例? - IBSI 1.0(2016)和 2.0(2020)之间的差异对你的工作有实质影响吗? - PyRadiomics 的"参考标准"地位在 2024 年后是否被撼动?有没有更新的工具? - "深度放射组学"(CNN 特征 + 经典 ML)在你的实践中真的比"端到端 CNN"好吗?
值得复现的实践: - 用 PyRadiomics 提取一个小型胸部 CT 病灶的 GLCM/GLRLM 特征,验证不同 bin 数量对特征值的影响。 - 跑一个完整的"放射组学 + LASSO + Logistic 回归"分类任务(公开数据集如 LIDC-IDRI),用 10 折 CV 评估 AUC。 - 实现并比较:放射组学+SVM vs 端到端 ResNet50 在同一肺结节数据集上的性能。 - 用 ICC 评估同一患者两次扫描的"特征稳定性",过滤掉 ICC<0.75 的不稳定特征。 - 跑一个"深度放射组学"实验:用预训练 ResNet50 倒数第二层(2048 维)特征 + XGBoost 分类。
重要参考文献
[X1] Zwanenburg A, Leger S, Vallières M, Löck S; IBSI Initiative. The Image Biomarker Standardisation Initiative. (IBSI 1.0, 2016). DOI: 10.1148/radiol.2020191145. (2016 标准) [X2] Zwanenburg A, et al. Update to the IBSI 1.0 standard. (IBSI 2.0, 2020). [X3] van Griethuysen JJM, Fedorov A, Parmar C, et al. Computational radiomics system to decode the radiographic phenotype. Cancer Res. 2017;77(21):e104–7. DOI: 10.1158/0008-5472.CAN-17-0339. (PyRadiomics 论文) [X4] Lambin P, Rios-Velazquez E, Leijenaar R, et al. Radiomics: extracting more information from medical images using advanced feature analysis. Eur J Cancer. 2012;48(4):441–6. DOI: 10.1016/j.ejca.2011.11.036. (放射组学概念起源) [X5] Baessler B, Luecke C, Lurz J, et al. Cardiac MRI and texture analysis of myocardial T1 and T2 maps in acute myocarditis. Radiology. 2018;289(2):381–8. DOI: 10.1148/radiol.2018180411. [X6] Baessler B, Luecke C, Lurz J, et al. Cardiac T1 mapping and extracellular volume (ECV) maps in hypertrophic cardiomyopathy: texture analysis of myocardial T1 and ECV. Radiology. 2018;286(1):132–45. (肥厚型心肌病纹理分析) [X7] Baessler B, Mannil M, Oebel S, et al. Subacute and chronic left ventricular myocardial scar: accuracy of texture analysis on nonenhanced cine MR images. Radiology. 2018;286(1):154–62. (心肌瘢痕纹理) [X8] Haralick RM, Shanmugam K, Dinstein I. Textural features for image classification. IEEE Trans Syst Man Cybern. 1973;SMC-3(6):610–21. DOI: 10.1109/TSMC.1973.4309314. (GLCM 原始论文) [X9] van Timmeren JE, Cester D, Tanadini-Lang S, Alkadhi H, Baessler B. Radiomics how-to guide. (Radiomics 实践指南) [X10] Gillies RJ, Kinahan PE, Hricak H. Radiomics: images are more than pictures, they are data. Radiology. 2016;278(2):563–77. DOI: 10.1148/radiol.2015151169. (放射组学口号原句) [X11] Aerts HJWL, Velazquez ER, Leijenaar RTH, et al. Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach. Nat Commun. 2014;5:4006. DOI: 10.1038/ncomms5006. [X12] Vickers AJ, Elkin EB. Decision curve analysis: a novel method for evaluating prediction models. Med Decis Making. 2006;26(6):565–74. DOI: 10.1177/0272989X06295361. (DCA 临床效用评估)