第 38 章 心脏超声成像:AI 的角色(Cardiac Ultrasound Imaging: The Role of Artificial Intelligence)
作者
- Karthik Seetharam, MD —— West Virginia University Medicine Heart & Vascular Institute, Morgantown, WV, USA。
- Partho P. Sengupta, MD, DM(通讯作者)—— 同单位;Rutgers Robert Wood Johnson Medical School, Rutgers University;国际心脏超声 AI 领军学者。
本章位于 Part III 心脏应用部分,承接第 37 章(核医学)后,转向心脏超声(echocardiography)——临床最常用、实时性最强的心脏影像。属于"应用 + 综述"性质的章节,涵盖 AI 在超声心动图的临床诊断、心功能评估、新表型识别、精准医学的全面应用。Sengupta 团队是国际心脏超声 AI 的代表,在多个 ML + 超声表型聚类研究上有重要贡献。
内容概述
超声心动图是心血管影像最常用的手段,单次扫描可产生 PB 级数据。本章按"高级临床解释 → 精度提升 → 新表型识别 → 充血性心衰表型聚类"组织:
- 数据扩张的挑战:超声产生 petabytes 数据,传统统计难处理;ML 在大数据下预测能力提升。
- AI 与超声的连接:AI / ML 可自动化任务、发现隐藏模式、支持斑点追踪(speckle tracking)临床整合。
- 高级临床解释:
- Narula 等 [X16] 集成算法区分 HCM vs. 运动员心脏,Volume (IG=0.24) + mid-LV 段 (IG=0.134) 最佳。
- Sengupta 等 [X17] associate memory classifier 区分缩窄性心包炎 vs. 限制性心肌病,AUC 89.2% (单独) → 96.2% (加入超声参数)。
- 精度提升:
- Asch 等 [X18] ML EF 自动化,r = 0.95 与人工一致。
- Knackstedt 等 [X19] ML EF 255 例,ICC 0.78–0.86。
- Kusunose 等 [X20] DL EF 验证 r = 0.82 ± 0.02。
- Kusunose 等 [X21] DL 区域室壁运动异常 AUC 0.99 vs. 住院医师 0.90 (p = 0.002)。
- Zhang 等 [X22] 14,035 例 CNN 视图识别 96% 准确率。
- Madani 等 [X23] DL 视图分类 91.7% 准确率 vs. 认证医师 70.2–84.0%。
- Madani 等 [X24] DL 自动解读 94.4% 准确率。
- 新表型识别:
- Casaclang-Verzosa 等 [X26] 拓扑数据分析(TDA)区分 AS 严重程度,loop 上严重与轻度在两端、中度在中间。
- Kwak 等 [X27] AS 无监督聚类 3 簇,死亡率 13.3% / 19.8% / 6.0% (p < 0.001)。
- Todoki 等 [X28] 866 例无监督学习预测 MACE,4 个不同 cluster。
- HF 表型聚类:
- Lancaster 等 [X29] 559/866 例 DD,2 个 cluster,kappa 0.41。
- Omar 等 [X30] LA + LV 应变聚类 3 组。
- Omar 等 [X31] 14 个斑点追踪特征,80% 检出 PCWP > 18 mmHg。
- Tabassian 等 [X32] 18 节段速度 / 应变 / 应变率,HFpEF AUC 0.89。
- Mishra 等 [X33] HF 住院风险聚类。
- Przewlocka-Kosmala 等 [X34] HFpEF LV 收缩储备与运动不耐受。
- Cho 等 [X35] 297 例 4 簇,Cluster IV stage C/D HF 78% + MACE 高发。
核心方程与概念
1. 超声影像的"大数据"特性
- 单次扫描 ~ 30–60 帧 / 心动周期 × 多个切面 × 多普勒模式 → PB 级 / 年
- 传统统计学在多变量、高维、非线性数据上预测能力弱
- ML 在大数据下预测能力提升("数据为王")
2. 监督 vs. 非监督学习
- 监督学习(Narula, Sengupta, Asch, Kusunose 等):给定 \((X, y)\) 标签对。
- Logistic 回归、SVM、随机森林、XGBoost、CNN。
- 非监督学习(Casaclang-Verzosa, Kwak, Todoki, Lancaster 等):仅 \(X\),无标签。
- k-means、层次聚类、TDA、PCA、autoencoder。
3. 拓扑数据分析(TDA, Casaclang-Verzosa [X26])
TDA 用"形状"(topology)描述高维数据分布的"环"(loop)结构。 - AS 患者在"疾病空间"形成 loop:严重与轻度 AS 在两端、中度 AS 在中间。 - 这是"非线性流形学习"的实例——比 PCA / t-SNE 更保持全局结构。
4. 卷积神经网络(CNN)
CNN 是当前心脏超声 AI 主流架构: - 卷积层(提取特征) - 池化层(下采样) - 全连接层(分类 / 回归)
应用: - 视图分类(parasternal long axis 96% 准确率,Zhang [X22]) - 图像分割(心腔边界) - 室壁运动异常检测(Kusunose [X21]) - 自动 EF 评估(Kusunose [X20])
5. 斑点追踪(speckle tracking)
斑点追踪通过追踪心肌回声斑点的位移计算应变(strain),是评估心肌机械功能的方法。AI 的介入可: - 自动化斑点追踪(减少人工时间) - 多参数融合(应变 + EF + 速度 → 综合评估) - 新表型识别(HFpEF 亚组)
6. 心脏超声的 ML 关键论文总结
| 研究 | ML 类型 | 任务 | 性能 |
|---|---|---|---|
| Narula [X16] | 监督 | HCM vs. 运动员心脏 | Volume + mid-LV IG 最高 |
| Sengupta [X17] | 监督 | 缩窄性心包炎 vs. 限制性心肌病 | AUC 89.2% → 96.2% |
| Asch [X18] | ML | 自动化 EF | r = 0.95 |
| Knackstedt [X19] | AI | 自动化 EF | ICC 0.78–0.86 |
| Kusunose [X20] | DL | 自动化 EF | r = 0.82 |
| Kusunose [X21] | DL | 区域 WMA | AUC 0.99 vs. 住院医师 0.90 |
| Zhang [X22] | CNN | 视图 + 分割 | 视图 96% |
| Madani [X23] | DL | 视图分类 | 91.7% vs. 医师 70.2–84.0% |
| Madani [X24] | DL | 自动解读 | 94.4% 分类、91.2% LVH |
| Casaclang-Verzosa [X26] | TDA | AS 表型 | Loop 区分严重 vs. 轻度 |
| Kwak [X27] | 无监督 | AS 聚类 | 3 簇死亡率差异显著 |
| Todoki [X28] | 无监督 | MACE 预测 | 4 簇 |
| Lancaster [X29] | 无监督 | DD 聚类 | 2 簇,kappa 0.41 |
| Omar [X30] | 无监督 | LA + LV 应变 | 3 组 |
| Omar [X31] | 监督 | PCWP > 18 | 80% 检出 |
| Tabassian [X32] | 监督 | HFpEF | AUC 0.89 |
| Mishra [X33] | 无监督 | HF 住院风险 | 多簇 |
| Przewlocka-Kosmala [X34] | 无监督 | HFpEF LV 储备 | 关联运动不耐受 |
| Cho [X35] | 无监督 | HF 4 簇 | Cluster IV stage C/D 78% |
7. 关键概念辨析
- AI 工具 vs. 自动化算法:传统 EF 自动化算法(如 Simpson 法)有 30+ 年历史,不属于"AI"。现代 AI 工具(CNN、autoencoder)能处理非典型形态、缺失边界。
- 监督 vs. 无监督的临床价值:监督学习需要标签(耗时、稀缺),无监督学习(聚类、TDA)可发现"未标记的"新表型——后者在精准医学上更有价值。
- HCM vs. 运动员心脏的鉴别:传统判别基于形态 + ECG;ML 用"集成算法"提取"人眼不可见"模式(Volume IG 0.24)。
- 缩窄性心包炎 vs. 限制性心肌病:形态相似(心肌厚度正常、充盈受限),但治疗截然不同(缩窄性心包炎 → 心包剥离术 vs. 限制性心肌病 → 内科治疗)。Sengupta associate memory classifier 是关键工具。
- AS 严重度的"loop" 模型:传统 AS 严重度分类(轻度 / 中度 / 重度)基于单一参数(mean gradient, AVA);TDA 发现 AS 在"疾病空间"形成 loop,重度与轻度在两端、中度在中间——这暗示 AS 是"连续疾病"而非离散分类。
- HFpEF 亚组:传统 HFpEF 定义基于 EF(≥ 50%);AI 聚类发现多个表型(应变异常亚组、LA 功能异常亚组、运动不耐受亚组等)——这指向 HFpEF 治疗的"精准"方向。
- AI 工具的临床落地路径:视图分类 → 分割 → 自动 EF → 病理检测 → 风险预测 → 治疗建议——这是一个渐进路径,每一步都有不同的 AI 工具。
关键结论
- 超声是心血管影像最常用手段,AI 在其上应用最广泛。
- Narula [X16] 集成算法区分 HCM vs. 运动员心脏,Volume + mid-LV 是最佳特征。
- Sengupta [X17] associate memory classifier 区分缩窄性心包炎 vs. 限制性心肌病 AUC 89.2% → 96.2%。
- Asch [X18]、Knackstedt [X19]、Kusunose [X20] 三项研究证明 ML EF 自动化与人工高一致(r 0.82–0.95)。
- Kusunose [X21] DL 区域室壁运动异常 AUC 0.99 vs. 住院医师 0.90。
- Zhang [X22] 14,035 例 CNN 视图分类 96% 准确率,5 个常用切面分割。
- Madani [X23] DL 视图分类 91.7% vs. 认证医师 70.2–84.0%——AI 优于部分专家。
- Madani [X24] DL 自动解读 94.4% 分类准确率。
- Casaclang-Verzosa [X26] TDA 在 AS 上发现"loop" 结构,挑战传统离散分类。
- Kwak [X27] AS 无监督聚类 3 簇死亡率差异 13.3% / 19.8% / 6.0%。
- Lancaster [X29] DD 聚类 2 簇,kappa 0.41。
- Omar [X31] 14 斑点追踪特征 80% 检出 PCWP > 18 mmHg。
- Tabassian [X32] HFpEF 18 节段应变 AUC 0.89。
- AI 在心脏超声已从"视图分类 / 分割"扩展到"风险预测 / 精准医学"。
- AI + 超声最具实用价值的方向:自动 EF、区域 WMA、HCM vs. 运动员、缩窄性 vs. 限制性、AS 表型、HFpEF 亚组。
挑战和开放性问题
- 超声图像质量的高度异质性:操作者依赖、设备差异、患者体型——ML 跨设备 / 跨中心泛化难。
- "大数据的非大数据"悖论:单中心单设备可获大量图像,但跨中心"标注数据"仍稀缺。
- DL 模型的"黑盒":CNN 给 EF 值但不告诉医生"看到了什么",临床接受度受限。
- i.i.d. 假设违反:训练 / 测试数据分布差异(不同设备、不同人群)导致性能下降。
- "FDA 批准 + 医保覆盖"的滞后:超声 AI 工具部分已 FDA 批准(如 LV EF 自动化),但医保覆盖与工作流整合仍不成熟。
- AI + 精准医学的"亚组过拟合"风险:Kwak [X27] 3 簇、Cho [X35] 4 簇——簇数选择本身有"分析师自由度",跨样本可重复性未充分验证。
- HFpEF 亚组的"治疗转化":ML 发现 HFpEF 多个表型,但表型特异治疗(如某亚组用 SGLT2 抑制剂、某亚组用 ARNI)证据稀缺。
- AI 工具的临床整合路径:自动 EF 等工具需要集成到 PACS / 工作站,工程 + 监管环节仍需大量工作。
- 超声 vs. CMR 的"代差":CMR 是评估心功能的"金标准",超声 AI 工具的"准确性"仍需与 CMR 对照。
- AI + 移动医疗的"远程"应用:手持超声 + 5G + 云 + AI 在偏远地区有巨大潜力,但网络、监管、培训瓶颈显著。
- 伦理与偏倚:训练数据偏倚(人群、设备)可能导致 AI 工具在不同人群中表现差异——需要公平性评估。
- AI 与临床医生关系:AI 不会替代超声医师,但 AI 使用者会替代不使用者——培训 / 教育是核心。
个人反思与批判性分析
- Sengupta 团队的"国际超声 AI 中心"地位:Partho Sengupta 是 West Virginia University 心脏超声 AI 的国际领军,本章引用了大量 Sengupta 团队工作——读者应意识到这是"内行专家撰写的内行综述",方法学偏好(无监督聚类、应变分析)反映了该团队的特长。
- AI 在超声上的"早起步、慢落地"现实:超声 AI 工具(如 LV EF 自动化)已部分商业化(EchoNous、Ultromics、Bay Labs),但与 CT/CMR 上的"全栈 AI 平台"(HeartFlow + 钙化 + 斑块 + CAD-RADS)相比仍显零散。这是超声"模态碎片化"的反映。
- "视图分类 96% 准确率"的工程意义:Zhang [X22] 等的 CNN 视图分类看似"低技术含量",但实际上是后续所有 AI 工具的基础——没有准确的视图分类就无法做心腔分割。视图分类是"默默的基础设施"。
- Madani 91.7% vs. 医师 70.2–84.0% 的解读需谨慎:91.7% 是单中心数据,医师 70.2–84.0% 可能包括不同经验级别——这不能直接解读为"AI 优于所有医师"。
- TDA "loop" 的"方法学新颖性":Casaclang-Verzosa [X26] 用 TDA 在 AS 上发现"loop" 结构是方法学创新,但临床价值在于"挑战离散分类"——而非直接改变治疗。这是"方法学贡献"与"临床贡献"的区分。
- Kwak [X27] 3 簇、Cho [X35] 4 簇的"分析师自由度":簇数选择本身有"自由度"——同一数据用 3 簇 vs. 4 簇可能都"看起来合理"。读者应警惕"亚组过拟合"风险。
- HFpEF 亚组"治疗转化"差距:ML 发现 HFpEF 多个表型(应变异常、LA 功能异常、运动不耐受等),但表型特异治疗证据稀缺——这是"诊断 AI"超过"治疗 AI"的典型现象。
- AI + 移动医疗的"远程应用"潜力:手持超声 + 5G + 云 + AI 在偏远地区有巨大潜力,但网络、监管、培训瓶颈显著。这是"AI for global health"的真正机会。
- "AI 工具使用者替代不使用者"的职业转变:未来超声医师不会被 AI 替代,但会使用 AI 的医师会替代不使用 AI 的医师——这是医学职业的代际转变。
- 超声 vs. CMR 的"互补而非替代":CMR 是评估心功能的"金标准"(无辐射、软组织对比优),超声是"一线"(普及、可重复、便携)。AI 在两者上各有价值,互补而非替代。
- "AI 万能"与"AI 仅辅助"的两端:本章在 EF 自动化、视图分类、WMA 检测上乐观(已部分商业化),在 HFpEF 亚组治疗、跨人群公平性上保守(仍待验证)。这种"该强则强、该弱则弱"是超声 AI 的工程现实。
- 与第 25-37 章的协同:本章是超声主题专项,与 CT(Ch 25-27)、CMR(Ch 32-36)、核医学(Ch 37)形成"四大模态 AI"完整图景。读者通过对比可学会"AI 在不同模态的共性与差异"——超声是"实时 + 普及"的代表,CMR 是"无辐射 + 多参数"的代表。
重要参考文献
- [X1] Sengupta PP, Narula J. The future of echocardiography. JACC Cardiovasc Imaging. 2018;11(5):778-81.
- [X9] Sengupta PP, Narula J, Chandrashekhar Y. The smartphone as a clinical platform for echocardiography. JACC Cardiovasc Imaging. 2019;12(9):1747-50.
- [X12] Virnig BA, Shippee ND, O'Donnell B, et al. Trends in the use of echocardiography, 2007 to 2011. Medicare Data Report. 2014.
- [X16] Narula S, Shameer K, Salem Omar AM, et al. Machine-learning algorithms to automate morphological and functional assessments in 2D echocardiography. J Am Heart Assoc. 2016;5(6):e003688.
- [X17] Sengupta PP, Huang YM, Bansal M, et al. Cognitive machine-learning algorithm for cardiac imaging: a pilot study. Eur Heart J. 2016;37(24):1878-89.
- [X18] Asch FM, Poilvert N, Abraham T, et al. Automated echocardiographic quantification of left ventricular ejection fraction without use of contour tracing. J Am Soc Echocardiogr. 2019;32(3):358-67.
- [X19] Knackstedt C, Bekkers SC, Schummers G, et al. Fully automated versus standard tracking of left ventricular ejection fraction. JACC Cardiovasc Imaging. 2015;8(11):1376-87.
- [X20] Kusunose K, Haga A, Yamaguchi N, et al. Deep learning for assessment of left ventricular ejection fraction in echocardiography. JACC Cardiovasc Imaging. 2020;13(2 Pt 1):374-84.
- [X21] Kusunose K, Abe T, Haga A, et al. A deep learning approach for assessment of regional wall motion abnormalities from echocardiographic images. JACC Cardiovasc Imaging. 2020;13(2 Pt 1):374-85.
- [X22] Zhang J, Gajjala S, Agrawal P, et al. Fully automated echocardiogram interpretation in clinical practice. Circulation. 2018;138(16):1623-35.
- [X23] Madani A, Arnaout R, Mofrad M, Arnaout R. Fast and accurate view classification of echocardiograms using deep learning. NPJ Digit Med. 2018;1:6.
- [X24] Madani A, Ong JR, Tibrewal A, et al. Deep echocardiography: data-efficient supervised and semi-supervised deep learning towards automated interpretation. NPJ Digit Med. 2018;1:59.
- [X26] Casaclang-Verzosa G, Shrestha S, Khan MS, et al. Network analysis of phenotypic patterns of left ventricular response to aortic stenosis. JACC Cardiovasc Imaging. 2019;12(12):2367-76.
- [X27] Kwak S, Lee Y, Ko T, et al. Unsupervised phenotyping of severe aortic stenosis using clustering. JACC Cardiovasc Imaging. 2020;13(7):1482-94.
- [X28] Todoki H, Sugimoto K, Tanabe K, et al. Unsupervised machine learning for MACE prediction. J Am Coll Cardiol. 2018;71(11):A1640.
- [X29] Lancaster MC, Salem Omar AM, Narula S, et al. Phenotypic clustering of left ventricular diastolic dysfunction. J Am Soc Echocardiogr. 2019;32(8):931-8.
- [X30] Omar AMS, Bansal M, Sengupta PP. Advances in echocardiographic imaging in heart failure. Curr Cardiol Rep. 2018;20(9):75.
- [X31] Omar AMS, Narula S, Abdel Rahman MA, et al. Two-dimensional speckle tracking for LV filling pressure estimation. J Am Soc Echocardiogr. 2017;30(9):867-75.
- [X32] Tabassian M, Pesser N, Stiekema LCA, et al. LV strain and strain rate during exercise in HFpEF. JACC Cardiovasc Imaging. 2018;11(11):1555-65.
- [X33] Mishra RK, Tison GH, Wang L, et al. Unsupervised phenotyping of HFpEF. JACC Cardiovasc Imaging. 2018;11(2 Pt 1):267-9.
- [X34] Przewlocka-Kosmala M, Marwick TH, Yang H, et al. Association of reduced LV systolic reserve with exercise intolerance in HFpEF. JACC Cardiovasc Imaging. 2019;12(11 Pt 1):2260-72.
- [X35] Cho JS, Shrestha S, Kagiyama N, et al. Machine learning-based phenogrouping in HF. JACC Cardiovasc Imaging. 2019;12(9):1831-43.