第24章基于人工智能的冠脉钙化评估（Artificial Intelligence-Based Evaluation of Coronary Calcium）

作者

Sanne G. M. van Velzen, MSc — Image Sciences Institute, UMC Utrecht, The Netherlands.
Nils Hampe, MSc — 同单位.
Bob D. de Vos, PhD — 同单位.
Ivana Išgum, PhD（通讯作者）— 同单位; Department of Biomedical Engineering and Physics, Amsterdam UMC. 荷兰Utrecht钙化AI先锋。

本章是 Part III「心脏应用」的CAC评分AI专章——讲DL如何自动化Agatston/钙化质量评分。

内容概述

核心论点：(1) CAC评分是CVD风险分层的金标准——Agatston（1990）是最广泛用的CAC量化方法；(2) 传统手工CAC评分的3大步骤：① 识别钙化区域（>130 HU）、② 勾画ROI、③ Agatston公式（面积×密度权重1/2/3/4）求和；(3) AI CAC评分的3大范式：① 传统ML（基于handcrafted特征）、② CNN分割（U-Net/V-Net 3D直接分割钙化 → Agatston计算）、③ 端到端回归（CNN直接从CT预测Agatston评分——跳过分割）；(4) Agatston vs 钙化质量（Calcium Mass）——钙化质量客观（不受kV影响）但临床标准仍是Agatston；(5) AI CAC评分的准确度：Išgum团队的CNN（2015-2020）达到与手工评分ICC 0.98+——已近似人类间变异；(6) 低剂量CT的CAC（肺癌筛查CT自动CAC）——AI可从LDCT自动算CAC，扩展CAC评分的临床场景。

核心方程与概念

0. 几个量化表达

Agatston评分公式：\(A = \sum_{slice} A_{slice} \times w_{slice}\)，其中 \(A_{slice}\) 是钙化面积（mm²），\(w_{slice} \in \{1, 2, 3, 4\}\) 基于最大HU：<200=1, <300=2, <400=3, ≥400=4。
钙化质量（Calcium Mass）：\(M = \sum_{slice} \rho \times V_{slice}\)，\(\rho\) 是钙化密度（mg/cc HA），\(V\) 是体积→更客观但需校准。
AI vs 手工评分一致性：de Vos 2019 Isgum团队：ICCs > 0.98，与手工-手工间ICC 0.95-0.99相当。
LDCT CAC估算：肺癌筛查LDCT（无ECG门控）→ AI自动CAC → 与门控CAC的相关性r=0.85-0.92。
MESA 10年风险：CAC=0 → 10年事件率<2%；CAC>400 → >20%。

0.5 关键公式

U-Net 3D钙化分割（de Vos 2019）：CNN分割钙化体素 → thresholding >130 HU → Agatston/Calcium Mass求和。
端到端回归（Canonical Regression）：\(CAC_{pred} = f_{CNN}(CT_{volume})\) 直接预测总Agatston→跳过分割。

1. CAC评分的临床应用

无症状人群风险分层：MESA/Framingham/CAC Consortium——CAC是独立的最强预测因子。
CAC=0的强阴性预测：10年MACE风险<2%（Blaha 2015）——"warranty period" 5-7年。
CAC>0的处理：启动或强化他汀/阿司匹林。
CAC评分临床意义：Agatston 0=极低风险, 1-99=低, 100-399=中, ≥400=高。

2. AI CAC评分的3大范式

传统ML（2010-2015）：手工特征（HU/形状/纹理）+分类器→钙化识别→Agatston求和——半自动仍需人工交互。
CNN分割（2015-2020）：U-Net 2D/3D → 体素级钙化分割 → Agatston/Calcium Mass自动计算——全自动。
端到端回归（2020+）：CNN→从整张CT预测Agatston——最快但可解释性差。

3. AI CAC评分的关键技术要素

心脏对齐：自动定位心脏区域→减少假阳性（骨骼/大血管钙化）。
多任务学习：同时预测钙化+冠脉分割+心腔分割→共享特征提取→精度提升。
低剂量CT适应性：LDCT噪声大→需去噪预处理或噪声鲁棒CNN。

4. 商用AI CAC产品

Siemens AI-Rad Companion：胸部CT自动CAC评分。
HeartLung/Nanox.ai：全自动CAC。
Zebra Medical：多任务CT AI含CAC。
Arterys：CAC云AI。
2024年NMPA批准：数坤/推想含CAC AI。

关键结论

CAC评分是CVD风险分层的最强独立预测因子——Agatston ≥400 → 高MACE风险。
AI CAC评分已达人类间变异水平（ICC>0.98）——技术成熟度最高。
LDCT CAC 扩展了CAC评分的临床场景（肺癌筛查pop）。
CNN分割是当前主流范式——体素级分割→Agatston/钙化质量双输出。
端到端回归正在兴起——更快但可解释性差。
商用AI CAC产品已在全球800+医院部署。

挑战和开放性问题

Agatston的可重复性依赖扫描参数——kV/mA/螺距改变影响Agatston值——跨扫描仪标准化方案缺失。
LDCT CAC的临床路径——肺癌筛查发现CAC>400→是否转心内科？——路径未建立。
AI CAC的"种族公平性"——MESA基于白人为主的pop——AI在亚洲/黑人上的一致性？
AI CAC的"过度诊断"风险——老年人群普遍有CAC——AI检出后是否导致不必要的下游检查？
CAC vs CCTA——CAC只能检测钙化，不能评估非钙化斑块/狭窄——CAC=0不等于无CAD。

个人反思与批判性分析

优势：AI CAC技术成熟度最高——ICC>0.98逼近人类变异；LDCT CAC扩展场景有价值；Agatston→钙化质量的技术演进清晰。

批判：① 过度强调精度——ICC>0.98已达到"临床可接受"——剩余问题不是技术精度而是临床路径（LDCT CAC→心内科转诊？）；② "CAC=0不等于无CAD" 未充分展开——约5-10% CAC=0患者有显著非钙化斑块——AI CAC ≠ AI CAD排除；③ 不同人群Agatston参考值差异——亚洲人CAC阈值低于白人（MESA-CAC Consortium基于白人为主pop）；④ CAC评分"更新"——2018 SCCT/NASCI CAC评分指南已提出Agatston应报告percentile而非绝对值——AI系统是否follow？⑤ 未讨论"AI CAC评分的经济价值"——自动化节省手工5-10分钟/例→年节省放射科技师/医生时间→具体ROI。

值得复现：训练U-Net CAC分割；在LDCT上评估AI CAC；比较Agatston vs 钙化质量的一致性。

AI冠脉钙化评分的临床价值与"过度诊断"悖论

AI CAC的最强场景不是诊断，而是"机会性筛查"。 美国每年做~8千万次胸部CT（肺癌筛查/急诊/术前），其中约30%包含心脏（即2400万例"附带CAC信息"）。传统上放射科医生不报告CAC——因为指南不要求（肺癌筛查指南不要求、急诊CT指南不要求）。但AI可以"顺便"自动算CAC，无需医生额外工作。

这2400万例中，约5-10%（即120-240万例）有CAC>400（高风险）。如果AI自动alert→转诊心内科→启动他汀/阿司匹林→预防1-5%的MACE事件（即每年可能预防6万-12万例MACE）。这是AI CAC最大的公共卫生价值。

但"过度诊断"悖论也存在。CAC随年龄增长自然累积——60岁以上人群CAC>0的比例超过70%。AI检出后如果医生"过度反应"——加用他汀（肌肉痛副作用）、阿司匹林（出血风险）、甚至转介侵入性冠脉造影（穿刺风险+辐射+对比剂肾病）——那么AI的"公共卫生收益"可能被"过度医疗"对冲掉。关键不是"AI检出了多少CAC"，而是"检出后医生的反应是否恰当"。 这是一个临床行为学问题而非AI技术问题。

Agatston的局限与钙化质量的"未实现潜力"

Agatston评分（1990年）的3大局限：（1）密度权重离散化——1/2/3/4四个等级，损失信息。例如，一个HU=399的钙化与HU=401的钙化，Agatston分别赋权3和4——相差33%但真实密度差仅2 HU；（2）对kV敏感——120 kV的Agatston与100 kV的不同（低kV使HU值偏高）→Agatston偏高；（3）仅算钙化面积——不考虑钙化体积和密度，而钙化体积对总钙化负荷的贡献更大。

钙化质量（Calcium Mass, mg/cc HA） 解决了这3个问题——它是连续值（不受HU离散化影响）、物理量（可跨kV校准）、基于体积（比面积更准确）。但为什么指南和临床仍然用Agatston？因为：（1）30年的预后数据都是基于Agatston（MESA/Framingham/CAC Consortium）——钙化质量的预后数据不够；（2）Agatston用130 HU阈值简单直观——钙化质量需要专用校准体模；（3）医生习惯了"Agatston 400"→"高风险"的简单映射。AI可以同时输出Agatston和钙化质量，推动临床"双重标准"过渡。

AI CAC评分的"商业现实"与"公平性问题"

商用AI CAC产品的"互操作困境"。Siemens AI-Rad Companion的CAC评分只输出Agatston——不能导出到非Siemens系统。Zebra Medical的CAC输出格式与HeartLung不同。医院如果在Siemens CT上运行HeartLung AI——先要"格式转换"（DICOM SR→结构化JSON→Agatston值）。这种互操作摩擦使很多医院"买了AI但用不起来"——这就是前面提到的"shelf-ware"问题。

AI CAC的种族/性别公平性。MESA数据集以白人为主（~40%白人, ~25%黑人, ~20%西班牙裔, ~10%华裔）——CAC评分参考值（percentile）是按白人/黑人的Agatston分布计算的。但亚洲人群的CAC自然积累速度慢于白人——同等Agatston在亚洲人中预示更高MACE风险（因为"亚洲人的100"相当于"白人的200"）。AI CAC如果训练在白人为主的MESA数据上—→在亚洲人群上倾向低估风险（即AI说"低风险"但实际是"中风险"）。2023年Allencherril等在JACC发表中国人群CAC预后数据——亚洲人CAC阈值应该是白人的~60-70%。商用AI CAC如果没有"亚洲模式"——对Jason所在的中国市场存在系统偏差。

LDCT CAC的"未开发的公共卫生金矿"。肺癌筛查正在全球推广——美国USPSTF推荐55-80岁30包年吸烟者每年LDCT。这些LDCT扫描自带心脏信息——但美国90%以上的肺癌筛查报告不包含CAC（因为没有reimbursement incentive）。如果AI可以"免费附赠"CAC评分（marginal cost ~0）——每年2400万附带CAC的CT→预防数万MACE——这个ROI是千倍级别的。但谁买单？肺癌筛查是CMS支付的（肺科），CAC评分是心血管的——跨科室的支付机制尚未建立。这是"政策-支付"问题而非技术问题。

重要参考文献

[X1] Agatston AS, et al. Quantification of coronary artery calcium using ultrafast CT. J Am Coll Cardiol. 1990;15(4):827–32. (Agatston原始论文) [X2] de Vos BD, et al. Direct prediction of cardiovascular events from coronary CT with deep learning. Radiology. 2019. [X3] Isgum I, et al. (Isgum团队) CAC AI综述. [X4] Blaha MJ, et al. Role of CAC=0. JACC Cardiovasc Imaging. 2015. (CAC=0 warranty period) [X5] McClelland RL, et al. MESA 10-year CHD risk with CAC. Circulation. 2015. [X6] van Velzen SGM, et al. (本章作者) CAC AI. [X7] Hampe N, et al. (本章作者) CAC AI. [X8] Hecht HS, et al. CAC scoring guidelines. J Cardiovasc Comput Tomogr. 2018. (SCCT/NASCI指南) [X9] Budoff MJ, et al. CAC Consortium. (大型CAC预后数据) [X10] Greenland P, et al. 2019 ACC/AHA CAC 评分指南. Circulation. 2019. [X11] Siemens AI-Rad Companion. https://www.siemens-healthineers.com [X12] HeartLung/Nanox.ai. https://www.nanox.ai

第24章 基于人工智能的冠脉钙化评估（Artificial Intelligence-Based Evaluation of Coronary Calcium）

作者