跳转至

第 38 章 心脏超声成像:AI 的角色(Cardiac Ultrasound Imaging: The Role of Artificial Intelligence)

作者

  • Karthik Seetharam, MD —— West Virginia University Medicine Heart & Vascular Institute, Morgantown, WV, USA。
  • Partho P. Sengupta, MD, DM(通讯作者)—— 同单位;Rutgers Robert Wood Johnson Medical School, Rutgers University;国际心脏超声 AI 领军学者。

本章位于 Part III 心脏应用部分,承接第 37 章(核医学)后,转向心脏超声(echocardiography)——临床最常用、实时性最强的心脏影像。属于"应用 + 综述"性质的章节,涵盖 AI 在超声心动图的临床诊断、心功能评估、新表型识别、精准医学的全面应用。Sengupta 团队是国际心脏超声 AI 的代表,在多个 ML + 超声表型聚类研究上有重要贡献。

内容概述

超声心动图是心血管影像最常用的手段,单次扫描可产生 PB 级数据。本章按"高级临床解释 → 精度提升 → 新表型识别 → 充血性心衰表型聚类"组织:

  1. 数据扩张的挑战:超声产生 petabytes 数据,传统统计难处理;ML 在大数据下预测能力提升。
  2. AI 与超声的连接:AI / ML 可自动化任务、发现隐藏模式、支持斑点追踪(speckle tracking)临床整合。
  3. 高级临床解释
  4. Narula 等 [X16] 集成算法区分 HCM vs. 运动员心脏,Volume (IG=0.24) + mid-LV 段 (IG=0.134) 最佳。
  5. Sengupta 等 [X17] associate memory classifier 区分缩窄性心包炎 vs. 限制性心肌病,AUC 89.2% (单独) → 96.2% (加入超声参数)。
  6. 精度提升
  7. Asch 等 [X18] ML EF 自动化,r = 0.95 与人工一致。
  8. Knackstedt 等 [X19] ML EF 255 例,ICC 0.78–0.86。
  9. Kusunose 等 [X20] DL EF 验证 r = 0.82 ± 0.02。
  10. Kusunose 等 [X21] DL 区域室壁运动异常 AUC 0.99 vs. 住院医师 0.90 (p = 0.002)。
  11. Zhang 等 [X22] 14,035 例 CNN 视图识别 96% 准确率。
  12. Madani 等 [X23] DL 视图分类 91.7% 准确率 vs. 认证医师 70.2–84.0%。
  13. Madani 等 [X24] DL 自动解读 94.4% 准确率。
  14. 新表型识别
  15. Casaclang-Verzosa 等 [X26] 拓扑数据分析(TDA)区分 AS 严重程度,loop 上严重与轻度在两端、中度在中间。
  16. Kwak 等 [X27] AS 无监督聚类 3 簇,死亡率 13.3% / 19.8% / 6.0% (p < 0.001)。
  17. Todoki 等 [X28] 866 例无监督学习预测 MACE,4 个不同 cluster。
  18. HF 表型聚类
  19. Lancaster 等 [X29] 559/866 例 DD,2 个 cluster,kappa 0.41。
  20. Omar 等 [X30] LA + LV 应变聚类 3 组。
  21. Omar 等 [X31] 14 个斑点追踪特征,80% 检出 PCWP > 18 mmHg。
  22. Tabassian 等 [X32] 18 节段速度 / 应变 / 应变率,HFpEF AUC 0.89。
  23. Mishra 等 [X33] HF 住院风险聚类。
  24. Przewlocka-Kosmala 等 [X34] HFpEF LV 收缩储备与运动不耐受。
  25. Cho 等 [X35] 297 例 4 簇,Cluster IV stage C/D HF 78% + MACE 高发。

核心方程与概念

1. 超声影像的"大数据"特性

  • 单次扫描 ~ 30–60 帧 / 心动周期 × 多个切面 × 多普勒模式 → PB 级 / 年
  • 传统统计学在多变量、高维、非线性数据上预测能力弱
  • ML 在大数据下预测能力提升("数据为王")

2. 监督 vs. 非监督学习

  • 监督学习(Narula, Sengupta, Asch, Kusunose 等):给定 \((X, y)\) 标签对。
  • Logistic 回归、SVM、随机森林、XGBoost、CNN。
  • 非监督学习(Casaclang-Verzosa, Kwak, Todoki, Lancaster 等):仅 \(X\),无标签。
  • k-means、层次聚类、TDA、PCA、autoencoder。

3. 拓扑数据分析(TDA, Casaclang-Verzosa [X26])

TDA 用"形状"(topology)描述高维数据分布的"环"(loop)结构。 - AS 患者在"疾病空间"形成 loop:严重与轻度 AS 在两端、中度 AS 在中间。 - 这是"非线性流形学习"的实例——比 PCA / t-SNE 更保持全局结构。

4. 卷积神经网络(CNN)

CNN 是当前心脏超声 AI 主流架构: - 卷积层(提取特征) - 池化层(下采样) - 全连接层(分类 / 回归)

应用: - 视图分类(parasternal long axis 96% 准确率,Zhang [X22]) - 图像分割(心腔边界) - 室壁运动异常检测(Kusunose [X21]) - 自动 EF 评估(Kusunose [X20])

5. 斑点追踪(speckle tracking)

斑点追踪通过追踪心肌回声斑点的位移计算应变(strain),是评估心肌机械功能的方法。AI 的介入可: - 自动化斑点追踪(减少人工时间) - 多参数融合(应变 + EF + 速度 → 综合评估) - 新表型识别(HFpEF 亚组)

6. 心脏超声的 ML 关键论文总结

研究 ML 类型 任务 性能
Narula [X16] 监督 HCM vs. 运动员心脏 Volume + mid-LV IG 最高
Sengupta [X17] 监督 缩窄性心包炎 vs. 限制性心肌病 AUC 89.2% → 96.2%
Asch [X18] ML 自动化 EF r = 0.95
Knackstedt [X19] AI 自动化 EF ICC 0.78–0.86
Kusunose [X20] DL 自动化 EF r = 0.82
Kusunose [X21] DL 区域 WMA AUC 0.99 vs. 住院医师 0.90
Zhang [X22] CNN 视图 + 分割 视图 96%
Madani [X23] DL 视图分类 91.7% vs. 医师 70.2–84.0%
Madani [X24] DL 自动解读 94.4% 分类、91.2% LVH
Casaclang-Verzosa [X26] TDA AS 表型 Loop 区分严重 vs. 轻度
Kwak [X27] 无监督 AS 聚类 3 簇死亡率差异显著
Todoki [X28] 无监督 MACE 预测 4 簇
Lancaster [X29] 无监督 DD 聚类 2 簇,kappa 0.41
Omar [X30] 无监督 LA + LV 应变 3 组
Omar [X31] 监督 PCWP > 18 80% 检出
Tabassian [X32] 监督 HFpEF AUC 0.89
Mishra [X33] 无监督 HF 住院风险 多簇
Przewlocka-Kosmala [X34] 无监督 HFpEF LV 储备 关联运动不耐受
Cho [X35] 无监督 HF 4 簇 Cluster IV stage C/D 78%

7. 关键概念辨析

  • AI 工具 vs. 自动化算法:传统 EF 自动化算法(如 Simpson 法)有 30+ 年历史,不属于"AI"。现代 AI 工具(CNN、autoencoder)能处理非典型形态、缺失边界。
  • 监督 vs. 无监督的临床价值:监督学习需要标签(耗时、稀缺),无监督学习(聚类、TDA)可发现"未标记的"新表型——后者在精准医学上更有价值。
  • HCM vs. 运动员心脏的鉴别:传统判别基于形态 + ECG;ML 用"集成算法"提取"人眼不可见"模式(Volume IG 0.24)。
  • 缩窄性心包炎 vs. 限制性心肌病:形态相似(心肌厚度正常、充盈受限),但治疗截然不同(缩窄性心包炎 → 心包剥离术 vs. 限制性心肌病 → 内科治疗)。Sengupta associate memory classifier 是关键工具。
  • AS 严重度的"loop" 模型:传统 AS 严重度分类(轻度 / 中度 / 重度)基于单一参数(mean gradient, AVA);TDA 发现 AS 在"疾病空间"形成 loop,重度与轻度在两端、中度在中间——这暗示 AS 是"连续疾病"而非离散分类。
  • HFpEF 亚组:传统 HFpEF 定义基于 EF(≥ 50%);AI 聚类发现多个表型(应变异常亚组、LA 功能异常亚组、运动不耐受亚组等)——这指向 HFpEF 治疗的"精准"方向。
  • AI 工具的临床落地路径:视图分类 → 分割 → 自动 EF → 病理检测 → 风险预测 → 治疗建议——这是一个渐进路径,每一步都有不同的 AI 工具。

关键结论

  • 超声是心血管影像最常用手段,AI 在其上应用最广泛。
  • Narula [X16] 集成算法区分 HCM vs. 运动员心脏,Volume + mid-LV 是最佳特征。
  • Sengupta [X17] associate memory classifier 区分缩窄性心包炎 vs. 限制性心肌病 AUC 89.2% → 96.2%。
  • Asch [X18]、Knackstedt [X19]、Kusunose [X20] 三项研究证明 ML EF 自动化与人工高一致(r 0.82–0.95)。
  • Kusunose [X21] DL 区域室壁运动异常 AUC 0.99 vs. 住院医师 0.90。
  • Zhang [X22] 14,035 例 CNN 视图分类 96% 准确率,5 个常用切面分割。
  • Madani [X23] DL 视图分类 91.7% vs. 认证医师 70.2–84.0%——AI 优于部分专家。
  • Madani [X24] DL 自动解读 94.4% 分类准确率。
  • Casaclang-Verzosa [X26] TDA 在 AS 上发现"loop" 结构,挑战传统离散分类。
  • Kwak [X27] AS 无监督聚类 3 簇死亡率差异 13.3% / 19.8% / 6.0%。
  • Lancaster [X29] DD 聚类 2 簇,kappa 0.41。
  • Omar [X31] 14 斑点追踪特征 80% 检出 PCWP > 18 mmHg。
  • Tabassian [X32] HFpEF 18 节段应变 AUC 0.89。
  • AI 在心脏超声已从"视图分类 / 分割"扩展到"风险预测 / 精准医学"。
  • AI + 超声最具实用价值的方向:自动 EF、区域 WMA、HCM vs. 运动员、缩窄性 vs. 限制性、AS 表型、HFpEF 亚组。

挑战和开放性问题

  • 超声图像质量的高度异质性:操作者依赖、设备差异、患者体型——ML 跨设备 / 跨中心泛化难。
  • "大数据的非大数据"悖论:单中心单设备可获大量图像,但跨中心"标注数据"仍稀缺。
  • DL 模型的"黑盒":CNN 给 EF 值但不告诉医生"看到了什么",临床接受度受限。
  • i.i.d. 假设违反:训练 / 测试数据分布差异(不同设备、不同人群)导致性能下降。
  • "FDA 批准 + 医保覆盖"的滞后:超声 AI 工具部分已 FDA 批准(如 LV EF 自动化),但医保覆盖与工作流整合仍不成熟。
  • AI + 精准医学的"亚组过拟合"风险:Kwak [X27] 3 簇、Cho [X35] 4 簇——簇数选择本身有"分析师自由度",跨样本可重复性未充分验证。
  • HFpEF 亚组的"治疗转化":ML 发现 HFpEF 多个表型,但表型特异治疗(如某亚组用 SGLT2 抑制剂、某亚组用 ARNI)证据稀缺。
  • AI 工具的临床整合路径:自动 EF 等工具需要集成到 PACS / 工作站,工程 + 监管环节仍需大量工作。
  • 超声 vs. CMR 的"代差":CMR 是评估心功能的"金标准",超声 AI 工具的"准确性"仍需与 CMR 对照。
  • AI + 移动医疗的"远程"应用:手持超声 + 5G + 云 + AI 在偏远地区有巨大潜力,但网络、监管、培训瓶颈显著。
  • 伦理与偏倚:训练数据偏倚(人群、设备)可能导致 AI 工具在不同人群中表现差异——需要公平性评估。
  • AI 与临床医生关系:AI 不会替代超声医师,但 AI 使用者会替代不使用者——培训 / 教育是核心。

个人反思与批判性分析

  • Sengupta 团队的"国际超声 AI 中心"地位:Partho Sengupta 是 West Virginia University 心脏超声 AI 的国际领军,本章引用了大量 Sengupta 团队工作——读者应意识到这是"内行专家撰写的内行综述",方法学偏好(无监督聚类、应变分析)反映了该团队的特长。
  • AI 在超声上的"早起步、慢落地"现实:超声 AI 工具(如 LV EF 自动化)已部分商业化(EchoNous、Ultromics、Bay Labs),但与 CT/CMR 上的"全栈 AI 平台"(HeartFlow + 钙化 + 斑块 + CAD-RADS)相比仍显零散。这是超声"模态碎片化"的反映。
  • "视图分类 96% 准确率"的工程意义:Zhang [X22] 等的 CNN 视图分类看似"低技术含量",但实际上是后续所有 AI 工具的基础——没有准确的视图分类就无法做心腔分割。视图分类是"默默的基础设施"。
  • Madani 91.7% vs. 医师 70.2–84.0% 的解读需谨慎:91.7% 是单中心数据,医师 70.2–84.0% 可能包括不同经验级别——这不能直接解读为"AI 优于所有医师"。
  • TDA "loop" 的"方法学新颖性":Casaclang-Verzosa [X26] 用 TDA 在 AS 上发现"loop" 结构是方法学创新,但临床价值在于"挑战离散分类"——而非直接改变治疗。这是"方法学贡献"与"临床贡献"的区分。
  • Kwak [X27] 3 簇、Cho [X35] 4 簇的"分析师自由度":簇数选择本身有"自由度"——同一数据用 3 簇 vs. 4 簇可能都"看起来合理"。读者应警惕"亚组过拟合"风险。
  • HFpEF 亚组"治疗转化"差距:ML 发现 HFpEF 多个表型(应变异常、LA 功能异常、运动不耐受等),但表型特异治疗证据稀缺——这是"诊断 AI"超过"治疗 AI"的典型现象。
  • AI + 移动医疗的"远程应用"潜力:手持超声 + 5G + 云 + AI 在偏远地区有巨大潜力,但网络、监管、培训瓶颈显著。这是"AI for global health"的真正机会。
  • "AI 工具使用者替代不使用者"的职业转变:未来超声医师不会被 AI 替代,但会使用 AI 的医师会替代不使用 AI 的医师——这是医学职业的代际转变。
  • 超声 vs. CMR 的"互补而非替代":CMR 是评估心功能的"金标准"(无辐射、软组织对比优),超声是"一线"(普及、可重复、便携)。AI 在两者上各有价值,互补而非替代。
  • "AI 万能"与"AI 仅辅助"的两端:本章在 EF 自动化、视图分类、WMA 检测上乐观(已部分商业化),在 HFpEF 亚组治疗、跨人群公平性上保守(仍待验证)。这种"该强则强、该弱则弱"是超声 AI 的工程现实。
  • 与第 25-37 章的协同:本章是超声主题专项,与 CT(Ch 25-27)、CMR(Ch 32-36)、核医学(Ch 37)形成"四大模态 AI"完整图景。读者通过对比可学会"AI 在不同模态的共性与差异"——超声是"实时 + 普及"的代表,CMR 是"无辐射 + 多参数"的代表。

重要参考文献

  • [X1] Sengupta PP, Narula J. The future of echocardiography. JACC Cardiovasc Imaging. 2018;11(5):778-81.
  • [X9] Sengupta PP, Narula J, Chandrashekhar Y. The smartphone as a clinical platform for echocardiography. JACC Cardiovasc Imaging. 2019;12(9):1747-50.
  • [X12] Virnig BA, Shippee ND, O'Donnell B, et al. Trends in the use of echocardiography, 2007 to 2011. Medicare Data Report. 2014.
  • [X16] Narula S, Shameer K, Salem Omar AM, et al. Machine-learning algorithms to automate morphological and functional assessments in 2D echocardiography. J Am Heart Assoc. 2016;5(6):e003688.
  • [X17] Sengupta PP, Huang YM, Bansal M, et al. Cognitive machine-learning algorithm for cardiac imaging: a pilot study. Eur Heart J. 2016;37(24):1878-89.
  • [X18] Asch FM, Poilvert N, Abraham T, et al. Automated echocardiographic quantification of left ventricular ejection fraction without use of contour tracing. J Am Soc Echocardiogr. 2019;32(3):358-67.
  • [X19] Knackstedt C, Bekkers SC, Schummers G, et al. Fully automated versus standard tracking of left ventricular ejection fraction. JACC Cardiovasc Imaging. 2015;8(11):1376-87.
  • [X20] Kusunose K, Haga A, Yamaguchi N, et al. Deep learning for assessment of left ventricular ejection fraction in echocardiography. JACC Cardiovasc Imaging. 2020;13(2 Pt 1):374-84.
  • [X21] Kusunose K, Abe T, Haga A, et al. A deep learning approach for assessment of regional wall motion abnormalities from echocardiographic images. JACC Cardiovasc Imaging. 2020;13(2 Pt 1):374-85.
  • [X22] Zhang J, Gajjala S, Agrawal P, et al. Fully automated echocardiogram interpretation in clinical practice. Circulation. 2018;138(16):1623-35.
  • [X23] Madani A, Arnaout R, Mofrad M, Arnaout R. Fast and accurate view classification of echocardiograms using deep learning. NPJ Digit Med. 2018;1:6.
  • [X24] Madani A, Ong JR, Tibrewal A, et al. Deep echocardiography: data-efficient supervised and semi-supervised deep learning towards automated interpretation. NPJ Digit Med. 2018;1:59.
  • [X26] Casaclang-Verzosa G, Shrestha S, Khan MS, et al. Network analysis of phenotypic patterns of left ventricular response to aortic stenosis. JACC Cardiovasc Imaging. 2019;12(12):2367-76.
  • [X27] Kwak S, Lee Y, Ko T, et al. Unsupervised phenotyping of severe aortic stenosis using clustering. JACC Cardiovasc Imaging. 2020;13(7):1482-94.
  • [X28] Todoki H, Sugimoto K, Tanabe K, et al. Unsupervised machine learning for MACE prediction. J Am Coll Cardiol. 2018;71(11):A1640.
  • [X29] Lancaster MC, Salem Omar AM, Narula S, et al. Phenotypic clustering of left ventricular diastolic dysfunction. J Am Soc Echocardiogr. 2019;32(8):931-8.
  • [X30] Omar AMS, Bansal M, Sengupta PP. Advances in echocardiographic imaging in heart failure. Curr Cardiol Rep. 2018;20(9):75.
  • [X31] Omar AMS, Narula S, Abdel Rahman MA, et al. Two-dimensional speckle tracking for LV filling pressure estimation. J Am Soc Echocardiogr. 2017;30(9):867-75.
  • [X32] Tabassian M, Pesser N, Stiekema LCA, et al. LV strain and strain rate during exercise in HFpEF. JACC Cardiovasc Imaging. 2018;11(11):1555-65.
  • [X33] Mishra RK, Tison GH, Wang L, et al. Unsupervised phenotyping of HFpEF. JACC Cardiovasc Imaging. 2018;11(2 Pt 1):267-9.
  • [X34] Przewlocka-Kosmala M, Marwick TH, Yang H, et al. Association of reduced LV systolic reserve with exercise intolerance in HFpEF. JACC Cardiovasc Imaging. 2019;12(11 Pt 1):2260-72.
  • [X35] Cho JS, Shrestha S, Kagiyama N, et al. Machine learning-based phenogrouping in HF. JACC Cardiovasc Imaging. 2019;12(9):1831-43.