第 10 章：将转录组学转化为临床实践——利用基因表达模式进行动脉粥样硬化的精准患者分型与分层（Translating transcriptomics into clinical practice: Utilizing gene expression patterns for advanced patient phenotyping and stratification in atherosclerosis）

优化动脉粥样硬化斑块深度转录组分析的研究设计（Optimizing study design for in-depth transcriptomic analysis of atherosclerotic plaques）

本章由 Sachs、Chemaly、Biessen、Matic 共同撰写,作者开宗明义指出:对动脉粥样硬化斑块开展深度转录组分析的研究设计,核心要素包括选择合适的样本来源、保证可重复性、应对技术挑战,从而给出生物学相关洞见。

作者建议研究应聚焦明确的生物学问题或临床未满足需求(未满足需求),例如阐明动脉粥样硬化的潜在机制、特定条件下的纵向斑块形成过程(atheroprogression)、或与患者脆弱性(patient vulnerability)相关的病变改变。在技术层面,关键目标应包括基线表达水平的鉴定、差异表达基因(differentially expressed genes, DEGs)的识别、细胞贡献分析、分子通路与网络的洞见、以及斑块进展中时空动态的解析。

所谓 DEGs,是指在研究比较的不同状态(例如早期、中期与晚期斑块形成阶段,或破裂与稳定斑块)之间显著上调或下调的基因,可作为理解疾病分子机制的基础步骤,并以多种方式应用:其一,理解疾病机制——DEGs 提供疾病进展的分子通路与生物过程洞见,以动脉粥样硬化为例,识别不同斑块形成阶段的 DEGs 可揭示炎症、脂质代谢与细胞行为如何促成斑块不稳定或破裂;其二,生物标志物、靶点与个体化医疗——DEGs 可作为早期疾病检测、疾病进展监测或临床结局预测的潜在生物标志物;源自 DEGs 的生物标志物可用于无创诊断检测或治疗反应指标;在疾病机制中起关键作用、表达改变的基因可作为治疗干预的靶点(例如理解特定 DEGs 如何促成斑块脆弱性,可导向稳定斑块或预防破裂的药物研发);其三,个体化医疗——DEG 分析可识别个体或亚组特异的基因表达模式,从而指导针对性治疗,这在遗传与环境因素影响疾病表现与进展的动脉粥样硬化中尤其相关;其四,药物再定位——与疾病机制关联的 DEGs 可与已知药物靶点交叉比对,潜在识别可被重新用于新治疗应用的现有药物;其五,跨疾病比较分析——DEG 分析可比较疾病、状态或治疗,凸显共有或独有的分子特征,例如比较稳定与破裂斑块中的 DEGs,可揭示可能用于预防不良事件的关键差异。

细胞贡献分析——理解动脉粥样硬化斑块的细胞景观对于剖析疾病进展的复杂性至关重要。实用的研究设计应优先采用可识别并量化斑块内不同细胞类型贡献的方法。高分辨率转录组学或对 bulk 数据的计算反卷积等技术应被纳入分析,以解析细胞异质性并刻画细胞群体的功能状态。研究设计应优先整合单细胞与 bulk 数据,获得细胞动态的多维度视图。利用计算方法进行细胞反卷积并与公开数据集交叉比对,可增强发现的深度与分辨率,进而丰富对细胞间通讯的理解,凸显驱动斑块脆弱性的关键细胞调控因子。

分子通路洞见——动脉粥样硬化由涉及脂质代谢、炎症、氧化应激、细胞增殖与凋亡、斑块内出血以及细胞外基质重塑的复杂分子网络协调。转录组学研究可用于揭示这些通路并定位其在斑块进展中的失调。分析方法旨在系统地绘制通路图谱,利用功能注释、富集分析与网络建模工具。基因集富集分析(GSEA)与通路分析工具(KEGG、Reactome、Hallmark、Ingenuity Pathway Analysis, IPA)可揭示关键信号级联。除典型通路外,转录组学研究还可通过整合方法(如加权基因共表达网络分析或蛋白-蛋白相互作用网络预测工具)发现新的分子相互作用与调控网络。这些洞见深化了对动脉粥样硬化分子驱动因素与关键互作组中枢的理解,为治疗干预开辟了新途径。

时空动态——斑块呈现空间异质性,纤维帽(fibrous cap)、坏死核心(necrotic core)、subintimal media remnants 与外膜(surrounding adventitia)各具不同的分子与细胞特征。空间转录组学(一种前沿方法)能将基因表达模式直接映射到组织切片上,保留空间信息。时间动态则刻画斑块随时间的进展——从早期脂质条纹(fatty streaks)到晚期易破裂病变。利用动物模型或带有连续取样的生物样本库进行的纵向研究,可提供宝贵的时间基因表达变化洞见。时空转录组学的结合,提供了对动脉粥样硬化斑块发展的综合视图。

无假说与有假说驱动的研究（Hypothesis-free and hypothesis-driven research）

在明确目标之外,作者建议进一步构建聚焦动脉粥样硬化基本机制的假说,以引导研究过程。这些假说可以相对宽泛,即探索炎症过程、细胞行为、分子信号通路之间的关系,及其对斑块发育与破裂的影响。通过聚焦这些更广泛的机制——即所谓"无假说研究"(hypothesis-free research)——研究可以生成有意义的洞见,同时保持对发现的适应性。

另一方面,构建更窄的假说则使研究者能够探究免疫细胞、血管平滑肌细胞、内皮细胞与分子信号通路之间复杂相互作用中的具体问题。历史上,该领域最著名的假说之一是:动脉壁内的慢性炎症促成动脉粥样硬化斑块的失稳(destabilization),从而增加破裂风险与随之而来的心血管事件。通过检验这类假说,研究者可揭示促成动脉粥样硬化起始与进展的特定分子靶点与细胞行为。最终,有假说驱动的研究提供了一种结构化的方法,用于研究疾病机制,并有助于识别旨在阻止或逆转斑块形成、减轻炎症、预防斑块破裂的治疗策略。

样本选择与实验设计（Sample selection and experimental design）

选择合适的样本是所有转录组学研究的重要基石,因为它直接影响结果的质量、相关性与可靠性。

人体样本——人体样本是研究斑块生物学最贴切的材料。理想情况下,斑块应取自接受颈动脉内膜切除术(c carotid endarterectomy)、冠状动脉旁路移植术(coronary artery bypass grafting)、下肢血管内介入或尸检的患者。这些来源可访问来自不同解剖部位的斑块,便于开展综合分析。虽然尸检材料对敏感的转录组分析的质量仍有争议,但其允许收集疾病进展的不同阶段,因此具有价值。

在采样过程中,纳入合适的对照同样关键。鉴于从同一患者获取匹配的健康血管组织较为困难,研究者使用了几种替代对照。最常见的对照之一是取自健康器官捐献者的正常动脉。但应考虑这些血管通常来自不同的血管床(如髂动脉、桡动脉或主动脉),可能无法准确反映所研究斑块的病理特征,因为来自不同解剖部位的血管组织可能因血流动力学、胚胎起源与血管特异性因素的差异而呈现不同的分子与细胞特性。相比之下,取自斑块周围区域的相邻、病变更少的组织(通常称为外周斑块组织)作为对照更为合适,因为它源自同一患者与同一解剖部位,可最大限度减少个体、遗传与环境变异性。

人口学与临床因素(年龄、性别、吸烟、用药、共病状态,如自身免疫病或其他血管病变)显著影响斑块生物学。老年人可能呈现更晚期的疾病或与年龄相关的转录组变化,而性别差异可影响斑块组成与基因表达模式。此外,糖尿病、高血压、高脂血症等共病可进一步改变斑块的细胞与分子特征。

动物模型——小型与大型动物模型(如小鼠模型如 ApoE 或 LDLR 敲除小鼠、兔模型、猪模型、恒河猴)可在受控条件下研究特定机制,从而补充人体研究。这些模型对研究疾病进展、细胞相互作用与定向遗传修饰尤为有价值。然而,必须承认当前动物模型存在显著局限:它们缺乏临床相关的晚期并发症,如斑块破裂、心肌梗死与缺血性卒中,这些恰恰是晚期人类动脉粥样硬化的标志性特征。鼠与兔模型虽能发展出晚期斑块,但很少呈现人类中观察到的破裂倾向与不稳定特征。这一差异主要源于物种间斑块组成、大小、机械性能的差异,以及脂质代谢与免疫反应的不同。猪模型在生理与心血管上更接近人类,但通常也不表现出自发性斑块破裂或卒中样症状结局。这一相关结局的缺失可能与其较短的寿命、独特的动脉粥样硬化病变发展模式,以及对人类中慢性危险因素(如长期高脂血症与高血压)暴露不足有关。物种特异性的血流动力学与斑块稳定性机制的组合进一步加剧了这些差异。这些局限强调了在将动物模型发现外推到临床情境时需要审慎。

总体而言,样本理想情况下应代表动脉粥样硬化进展的广泛谱系——从早期脂质条纹到中间病变与晚期斑块。纳入呈现薄纤维帽、大坏死核心、钙化与斑块内出血等特征的脆弱斑块,对理解斑块不稳定性的分子驱动因素尤为重要。这些阶段的均衡代表性,确保转录组分析能捕捉斑块生物学的关键过渡,从而获得对疾病更全面的理解。

确保高质量样本与统计效力（Ensuring high-quality samples and statistical power）

在处理动脉粥样硬化斑块样本时,维持 RNA 完整性至关重要,因为 RNA 降解会显著损害转录组分析。为降低此风险,从采集到保存的时效性处理必不可少。快速处理对于保留组织的分子特征至关重要,标准化的组织保存操作规程是确保可重复性并生成高质量数据的必要条件。推荐的技术包括在液氮中速冻样本,或将其浸入 RNA 稳定液(如 RNAlater),后者可有效稳定 RNA。此外,选择优化的 RNA 提取方法,并在适用时采用针对细胞类型的方案——如针对斑块组织的单细胞 RNA 测序(scRNA-seq)方案——可最大化 RNA 产量与质量,使下游分析可靠。评估 RNA 完整性数(RIN,使用 Bioanalyzer 等工具)以确保 RNA 质量也很有帮助。高精度研究应将 RIN 目标设定为大于 5。所有样本在这些实践中保持一致性,对生成稳健可重复的数据集至关重要。

进一步而言,确保队列中充足的样本量与多样性,对动脉粥样硬化的转录组学研究同等重要。最近的趋势强调纳入多样化人群的重要性,以解释受性别、年龄与遗传背景影响的基因表达变异性。统计模型应纳入这些变量,以减少混杂因素并增强发现的有效性。高级统计方法(包括纵向数据分析与整合基因组学)日益被用于监测表达变化,从而更深入地理解疾病进展。

转录组分析方法的选型（Selection of the method for transcriptomic profiling）

转录组学技术的最新进展——特别是微阵列、bulk RNA 测序(bulk RNA-seq)、scRNA-seq 与空间转录组学——已通过实现精准的基因表达谱分析,改变了对动脉粥样硬化的理解。微阵列虽曾是基因表达分析的主力,但 bulk RNA-seq 已被证明是更优越的方法,提供更全面、更细致的转录组视角。这种强大技术允许对整个组织或斑块内特定区域进行谱分析,生成具有绝对定量的宝贵全局基因表达数据。在足够测序深度下(通常每样本 2000 万至 5000 万读段),bulk RNA-seq 可可靠地检测稀有转录本异构体与低丰度基因。

scRNA-seq 则提供了对斑块内细胞多样性的卓越洞见。这种前沿方法通过在单细胞水平检验基因表达,识别不同细胞类型及其独特的基因签名。因此,scRNA-seq 已揭示关键细胞表型(包括结构性与炎性细胞),阐明了涉及动脉粥样硬化斑块发育与进展的细胞特异性通路。

空间转录组学通过使研究者能够将基因表达数据直接映射到组织切片上,保留细胞在其原生微环境中的空间信息,从而改变了这一定量领域。这种方法提供了对斑块结构组织的宝贵洞见,揭示不同细胞类型之间的空间关系,并识别与斑块脆弱性或稳定性相关的不同基因表达模式。通过整合空间与转录组信息,研究者可发现促成疾病进展的区域特异性分子签名,如炎性热点或富集平滑肌细胞的区域。

然而,与转录组学技术相关的高昂成本构成挑战。bulk RNA-seq 对整体组织谱分析相对经济;scRNA-seq 因文库制备成本更高、计算需求更大以及生物信息学专业知识的需要,显著更昂贵。空间转录组学更加昂贵与困难,需要高分辨率成像系统、复杂方案与先进数据分析流水线以整合空间数据与基因表达谱。因此,研究者必须仔细权衡成本与潜在收益,使技术选择与研究目标对齐。例如,新一代微阵列或 bulk RNA-seq 适合以更低成本生成全局基因表达谱;scRNA-seq 适合对细胞异质性与稀有细胞群的研究;空间转录组学对组织结构与空间基因表达异质性的研究尤其不可或缺,特别是在寻求将分子通路与动脉粥样硬化斑块结构变化联系起来的研究中。

选择合适的 RNA-seq 文库——例如链特异(stranded)文库或多聚 A 选 [poly(A)-selected] 文库——对于在不同转录组区域实现精确的基因表达映射至关重要,这也增加了总体成本。研究者应通过采用稳健的研究设计、利用现有资源(如公共数据集或生物样本库),以及在适用时采取样本混合等节省成本的措施,最大化成本效益比。最终,这些技术在识别新治疗靶点或生物标志物方面的潜力,证明了投入的合理性,尤其是在具有重要临床意义的转化研究中。

数据分析与生物信息学流水线（Data analysis and bioinformatic pipelines）

转录组数据的分析需要实施与研究目标直接对齐的、稳健且精心设计的生物信息学流水线。这些流水线涵盖若干关键组件,以确保结果的全面性与可靠性。

质量控制——确保原始测序数据的完整性至关重要。使用 FASTQC 或 MultiQC 等工具的质量控制检查有助于评估读段质量、GC 含量与接头污染等指标,识别可能损害下游分析的潜在问题。
比对与定量——高质量读段使用 STAR 或 HISAT2 等工具比对到参考基因组,这些工具提供精确的映射能力。HTSeq、featureCounts 或 kallisto 等工具常用于基因表达定量。这些工具生成基因或转录本水平的表达数据,构成下游分析的基础。
差异表达分析——差异表达分析识别实验组之间表达显著变化的基因。DESeq2、edgeR 或 limma 等软件可用于统计检验,提供 DEGs 列表及其倍数变化与显著性水平。然而,在大量基因上执行多重统计检验时,获得假阳性的可能性增加。为应对这一点,Benjamini-Hochberg 等多重检验校正方法对控制错误发现率至关重要,可确保所识别的 DEGs 在统计上可靠,并降低将非显著基因误判为显著的风险。
功能注释——通过功能注释工具揭示 DEGs 的生物学意义。基因本体(GO)分析根据生物过程、分子功能与细胞组分对基因进行分类。同时,使用 KEGG、Reactome 或 DAVID 等工具的通路富集分析揭示过度呈现的通路,而 GSEA 揭示基因表达数据中的复杂模式。
与临床数据整合——若临床变量可用(如血生化指标、患者症状、用药或结局),将其与转录组数据整合可增强分析的转化层面。这种方法可识别与临床结局相关的生物标志物,并凸显可预测疾病严重程度或治疗反应的基因表达谱。机器学习技术与多变量模型日益用于此类整合分析。
高级单细胞数据分析——对于单细胞转录组学,需要额外步骤,包括使用 Seurat、Scanpy 或 Cell Ranger 等工具进行细胞聚类、轨迹分析与细胞类型注释。在动脉粥样硬化研究中,此类流水线已对揭示不同细胞群体(如巨噬细胞与成纤维样细胞)在斑块发育与进展中的作用发挥了重要作用。

技术考量与验证（Technical considerations）

实际的转录组分析需要解决若干技术层面问题以确保准确性与可靠性。RNA-seq 数据的归一化对解释文库大小与基因长度的差异至关重要,每百万转录本(transcripts per million, TPM)、每千碱基每百万读段(reads per kilobase per million, RPKM)或修剪均值 M 值(trimmed mean of M-values, TMM)等方法被广泛使用。为应对由实验条件(如样本处理时间或保存条件)差异引起的批次效应,ComBat 或 RUV 等工具被用于减少不想要的变异并增强数据可比性。

在单细胞测序不可行的研究中,CIBERSORT 等计算方法可对细胞类型进行反卷积,从 bulk RNA-seq 数据估算各种细胞类型的比例。然而,scRNA-seq 数据的整合已显著增强了这一过程。利用 scRNA-seq 获得的详细细胞图谱,可实现对 bulk RNA-seq 数据集更准确的反卷积。BayesPrism(使用 scRNA-seq 数据作为先验)与 SCDC(整合多个 scRNA-seq 数据集)等工具可被用于更精确地估算细胞组成与基因表达。这些方法提供了对组织异质性的更细致洞见,特别是在动脉粥样硬化斑块这样复杂的组织中。

最后,对来自计算分析的关键发现进行实验验证至关重要。为此,来自全局转录组分析的主要结果可使用互补技术(如定量 PCR 或免疫组织化学)进行验证,以确认候选基因或通路的差异表达,并增强研究结论的稳健性。

伦理考量（Ethical considerations）

在开展涉及人体组织样本的研究时,遵守伦理原则与法律标准至关重要。所有人体组织样本必须在知情同意下采集,确保参与者充分了解研究目的、潜在风险与退出权。知情同意过程应遵守《赫尔辛基宣言》中阐明的伦理指南,该宣言强调尊重个体自主与保护生物医学研究中的参与者。此外,研究必须获得适当的机构审查委员会(Institutional Review Board, IRB)批准,以确保符合伦理标准与监管要求。这涉及参与者隐私、数据处理与保护弱势群体的考量。

所有研究必须遵守国家与国际人体研究法律,如欧洲的《通用数据保护条例》(GDPR),该条例涉及数据隐私与机密性。对于动物研究,遵守相关指南(如实验动物护理与使用委员会或同等机构制定的指南)是必要的,以确保人道对待并最小化动物痛苦。研究者应遵循 3R 框架的原则——Replacement(替代)、Reduction(减少)、Refinement(优化)——旨在最小化动物使用、减少所需数量并优化操作以减轻痛苦。

最后,在共享转录组数据时,研究者必须遵守既定的数据共享指南,如基因表达综合数据库(Gene Expression Omnibus)或 ArrayExpress 的指南,确保患者机密性与隐私得到严格维护。必须实施适当的数据匿名化以保护个体身份,同时促进科学透明与合作。

研究后考量（Poststudy considerations）

在完成全面的转录组分析后,将这些数据与其他组学方法(如蛋白质组学、代谢组学与表观基因组学)整合,可提供对斑块进展及亚表型分子驱动机制以及其脆弱性估算的更全面理解。整合多层组学数据使我们能捕捉潜在机制的复杂性,并洞悉基因表达如何在表观遗传、遗传、蛋白质或代谢物水平上正交调节。此类整合方法可揭示促成动脉粥样硬化病理生理学的关键驱动相互作用与调控网络。这些研究后考量提供了宝贵的工具,以深化并增强转录组发现的意义,支撑对动脉粥样硬化研究及其潜在临床应用更全面的方法。

成像与转录组学的整合——放射组学与放射转录组学（Integrating imaging with transcriptomics — radiomics and radiotranscriptomics）

放射组学与结合成像和转录组学的原理——临床斑块成像在动脉粥样硬化疾病管理中居核心位置,而斑块分子表型分析则具有挑战、成本高,主要在研究范围内针对选定数量的患者开展。然而,阐明脂质累积、炎症、细胞外基质重塑、免疫细胞激活与平滑肌细胞转分化等动脉粥样硬化过程的复杂性,以及它们对斑块表型的贡献,需要基于多模态数据整合的整体方法。

放射组学(radiomics)是人工智能(AI)驱动的过程,可从空间分辨图像中获取数百个定量参数,本质上将图像转换为通过形态学或几何特征量化动脉粥样硬化病灶的数据集——这些特征仅凭视觉评估无法理解。放射组学正在彻底改变临床成像领域,在动脉粥样硬化中尤其显示,放射组学参数在表征如"餐巾环征"(napkin ring sign)等脆弱斑块特征方面优于传统 CT 成像指标。然而,通过将放射组学与分子数据(如转录组学)结合,提高放射组学的"分子"分辨率与大量计算成像参数,是实现疾病亚表型分析并促进个体化治疗分配的关键。这一新兴领域被称为"放射转录组学"(radiotranscriptomics),作为放射组学的一个分支。

首批结合临床成像数据与转录组谱分析的研究在肿瘤学领域开创新河,开辟了通路映射、疾病亚表型分析与治疗反应监测的新可能性。例如,一项研究探索了胶质母细胞瘤中磁共振成像(MRI)体积测量与 mRNA 和 microRNA 表达水平的关联,并将放射表型与基因表达相关联,有效识别了可能决定癌症侵袭与转移的分子通路。另一项研究中,基于 AI(卷积自编码器神经网络)提取的相关 MRI 放射组学特征对肉瘤患者进行的聚类,与基于转录组学的聚类合并,以预测无转移生存的肉瘤患者。在非小细胞肺癌患者中,放射组学与转录组学数据整合改善了对免疫治疗的反应预测,其中转录组学可对高炎症(HOT)与低炎症(COLD)以及免疫系统激活的患者进行分类。这些癌症领域的例子凸显了放射转录组学在开发无创成像生物标志物方面的潜力,以增进对动脉粥样硬化中成像参数背后分子通路的理解。

动脉粥样硬化中的先进成像技术（Advanced imaging techniques in atherosclerosis）

动脉粥样硬化的治疗评估与临床管理在很大程度上依赖医学成像,后者有多种模式,可根据病变阶段调整。无创成像分为:(1)结构性方法,用于观察解剖异常,包括超声(US)、MRI 与 CT;(2)功能性方法,使用诊断剂或结合纳米颗粒的造影剂评估生理活动,涵盖功能性 MRI、正电子发射断层成像(PET)与单光子发射 CT(SPECT)。

US 是评估浅表血管(颈动脉与肢体动脉)中动脉粥样硬化斑块最广泛使用的首选成像方法,可评估狭窄程度、颈动脉斑块负荷与内膜中层厚度。CT 是一种相对廉价的成像技术,使用造影剂,可确定狭窄程度以及血管正性重塑、点状钙化、高衰减纤维斑块与低衰减富脂质坏死斑块。然而,CT 无法区分软组织成分(如纤维粥样瘤与出血和血栓)。MRI 主要适用于大血管,对软组织成分有较高分辨率,可估算斑块大小与组成(尤其是纤维含量)、脂质层、内皮通透性与新生血管,但对钙化的分辨率较低。PET 与 SPECT 是核成像方法(常与 CT 或 MRI 结合),使用少量放射性示踪剂研究巨噬细胞介导炎症、缺氧与宏观钙化富集区域的生物过程,但其空间分辨率低于 CT 与 MRI。

另一方面,有创斑块成像方法(如血管造影[使用含碘分子作为造影剂的荧光透视]或光学相干断层成像[OCT])可从近距离对动脉粥样硬化斑块进行更高分辨率的谱分析。使用 X 射线或 CT 血管造影的血管造影(无需插入导管)更常用于冠状动脉狭窄成像,能够检测钙化。OCT 提供与组织学高度相关的纤维帽详细表面图像,其中纤维帽的高信号与巨噬细胞黏附与血栓形成相关。

动脉粥样硬化中新兴的成像模式扩展了常规方法所能获取的参数,并为多模态数据整合提供了新可能性。血管内超声(IVUS)是一种有创斑块成像方法,与 CT 血管造影互补。IVUS 又称"虚拟组织学"(virtual histology),提供更高分辨率与更深层的斑块组成检测,识别富脂质坏死核心、钙化与纤维脂肪含量,但与传统 US 技术类似,其受限于矿化钙沉积造成的声学阴影。另一种有创分子成像技术是血管内近红外荧光(NIRF)成像,通过对脂质与巨噬细胞富集的可渗透动脉粥样硬化区域进行照明,使动脉粥样硬化细胞过程(包括炎症、氧化应激与异常内皮通透性)在体内可视化。通过光子计数 CT 可改善现有无创成像技术的分辨率,提供比传统 CT 更好的空间分辨率与对比度。

传统上难以用常规成像模式识别的脆弱斑块参数(如斑块内新生血管),现在已可实现。增强超声(contrast enhanced US, CEUS)等方法使用微泡造影剂,不仅可定量评估动脉粥样硬化狭窄程度,还可基于溃疡、新生血管与炎症浸润的存在,定性评估斑块的脆弱性。此外,多普勒超声成像(特别是超声微血流成像)能以高灵敏度将真实血流信号与周围组织运动分离,也能检测斑块内新生血管。这些新成像模式提供更高分辨率的斑块定量方法,在与转录组学数据整合后,有望促进对潜在分子签名的更佳理解。

将成像参数与基因表达谱相关联（Correlating imaging parameters with gene expression profiles）

得益于开源软件(如 ITK、3D Slicer、Pyradiomics)以及其他基于动脉粥样硬化斑块的分割方法的普及,从无创与有创成像中提取无穷的定量数据参数已成为可能。这允许对定性临床图像进行深入详细的参数化与分割,产生新的无创成像生物标志物测量,并奠定了放射组学这一革命性领域的基石。专用软件可用于分析 CT 扫描图像,分析与动脉粥样硬化诊断和进展相关的组织结构。例如,可通过测量血管周围脂肪组织的表型变化来检测血管炎症,使用一种称为脂肪衰减指数(fat attenuation index, FAI)的新成像指标。FAI 基于以下概念:人体血管对周围血管周围脂肪组织发挥旁分泌作用,影响局部细胞内脂质累积,可通过 CT 成像方法监测。FAI 近期展示了其在无阻塞性冠心病的个体中预测心血管风险的能力。

然而,通过将生成的成像生物标志物与转录组学数据结合,可以推断患者中正在进行的潜在斑块分子过程,以指导临床诊断与治疗选择。为此,将 CT 血管造影获得的斑块形态学特征与微阵列获得的斑块转录组整合,以预测分子签名,其中 IL1R1 表达与富脂质坏死核心体积相关,TGFBR2 与高钙化病变相关。

空间转录组学等新型分子组织学模式与放射转录组学数据叠加,为成像提供了新视角,补充了在研究 bulk 转录组学数据时常常缺失的空间分辨率。这再次在癌症领域开创新河,其中空间转录组学、bulk 转录组学与 MRI 成像被用于构建放射组学分类器,以预测肝细胞癌患者中高密度肿瘤周围三级淋巴结构。最近在动脉粥样硬化领域,一项研究将离体切除斑块的光声成像与超声与空间转录组学和蛋白质组学相结合,并将光声信号映射到基于胆红素的血液残留以及炎性与泡沫状巨噬细胞。然而,需要新型、创造性的 AI/ML 计算方法来改善多模态数据整合并辅助这些整合。

多模态数据整合策略（Integration strategies for multimodal data）

蓬勃发展的放射转录组学领域仍有许多障碍与挑战需要克服,尤其是在多模态整合工作流的设计与预测模型的准确性方面。总体而言,用于数据整合的方法旨在实现预测建模。首先,预处理阶段包括数据标准化与对放射组学或转录组学特征进行特征选择的关键步骤。例如,在 Buckler 等人的研究中,转录本的特征选择基于在高度钙化与非钙化斑块区域之间显著差异的转录本。另一方面,Bouhamama 等人使用降维方法选择若干放射组学特征。这些特征使用支持向量机预测建模与转录组学数据整合,将肿瘤分类为对免疫检查点治疗"有反应"或"无反应"(使用 HOT/COLD 分层用于具有活跃免疫环境的肿瘤)。

接下来,可使用矩阵分解(以识别转录组学与放射组学数据集之间的共享模式)或降维等方法进行数据整合。然而,图神经网络(基于已知生物通路与相互作用整合数据)、机器学习(随机森林、神经网络、支持向量机)与深度学习方法(如自编码器等卷积神经网络)是用于多模态数据整合的理想方法。其产出是疾病预测或治疗反应预测模型。在其研究中,Crombé 等人对基于 MRI 放射组学的若干患者分类方法进行了评估,并显示将转录组学数据与放射组学整合,增强了其肉瘤患者转移性无复发生存的预测价值。

然而,放射组学与转录组学数据整合会产生技术问题。关于数据可用性与质量,同时具有 RNA-seq 与医学影像数据的数据集数量有限。此外,用于提取放射组学特征的软件灵敏度低,并受技术伪影影响,因为它们可能因低图像分辨率提取"噪声",然后被解读为生物信号。不同放射组学工具箱之间的图像采集与特征提取缺乏标准化,导致当前放射组学研究结果的可重复性潜力较低。一种解决方案是在应用特征提取前使用深度学习方法协调图像,并遵循图像生物标志物标准化倡议(Image Biomarker Standardization Initiative)的图像处理设置。考虑数据对齐的难度也很重要,即确保放射组学与转录组学数据集之间的时间与空间对应可能难以解决。其他问题源于预测建模中使用的方法,例如模型过拟合的问题(模型在一个数据集上训练而缺乏泛化性)。此处,联邦学习训练结构可能成为解决方案(见下文)。

此外,放射组学研究方法的报告不足。已制定 CLEAR 清单(CheckList for Evaluation of Radiomics Research)以部分应对这些问题,并要求放射组学研究的研究者报告研究设计、图像采集与预处理、特征提取与选择、模型开发与验证,以及结果报告与解释。总体而言,多模态数据整合具有通过汇总临床与分子特征并生成可调预测模型来合成互补知识、调查动脉粥样硬化患者临床结局的潜力。然而,这些预测模型可能缺乏可解释性,将其与生物与临床数据整合(例如在风险评分设置中)将是指导临床行动的关键。

临床应用与意义（Clinical applications and implications）

放射组学研究已显示出令人鼓舞的临床潜力。心脏 MRI 的放射组学签名已能够改善肥厚性心肌病与高血压性心脏病——两种症状相似疾病——之间的鉴别,并区分梗死性不可存活与可存活的心肌结构,辅助患者预后。它们还实现了仅基于 CT 图像识别破裂倾向的动脉粥样硬化斑块,而无需执行有创(IVUS、OCT)与放射性核素成像(PET)。因此,放射组学与放射转录组学衍生的数据整合方法提供了若干临床益处:(a)对临床放射组学成像参数背后分子签名的更深入理解;(b)更准确的疾病亚表型分析与患者分层;以及(c)对治疗效果与安全性的更精确评估。

然而,要受益于多模态数据的全部临床潜力,将其整合到临床决策工具中至关重要。当前动脉粥样硬化一级或二级预防中的临床决策工具尚未标准化,缺乏预测能力,且不适合年轻动脉粥样硬化个体。这些风险评分虽在总体上有益,但未实现个体化,可通过整合新型分子与放射组学参数以实现更准确的风险预测而得到改善。这已在两项研究中成功实现——CT 扫描的血管周围 FAI 评分(冠状动脉炎症的指标)与动脉粥样硬化斑块负荷以及传统心血管风险因素被整合到风险预测算法中。这一方法改善了对未来致死性心脏事件的预测与非阻塞性冠心病的诊断,使该风险分层工具在已确诊心血管疾病患者的二级预防中具有价值。因此,放射转录组学为放射组学数据补充了缺失的分子层面,并具有通过允许使用成像特征进行无创分子患者亚表型分析,进一步改善临床决策工具的潜力。

挑战与未来方向（Challenges and future directions）

放射组学与放射转录组学正处于变革性疾病诊断、预后与个体化医学的前沿,这由数字孪生(digital twins)推动——数字孪生是一种创新概念,代表患者、器官、分子不同层级的数字模拟,提供对个体化风险因素、药物相互作用与治疗选项的洞见。为使这一变革成为现实,并由于 AI 训练需要大型数据库,医疗数据共享的联邦方法至关重要。联邦学习(federated learning)使用去中心化方法训练机器学习模型,同时将数据保留在本地,只共享模型更新。联邦学习缓解了以集中方式存储大型数据集的需要,并允许访问多模态数据,这些数据可能并非始终在集中数据库或医疗中心可用。最近,跨越 4 家英国医院应用的联邦学习方法改善了 COVID-19 检测模型的性能,表明这种方法可助力 AI 开发。已开展多项工作以汇聚来自各机构的数据,如法国 Health Data Hub、英国 Health Data Research UK 或 UK biobank。然而,联邦学习仍需克服数据协调、网络安全、隐私与数据保护的问题,因为患者再识别或信息泄露不能被排除,且必须考虑严格的数据保护法律。

总之,要释放动脉粥样硬化中多模态数据整合的力量,需要进行大规模多中心研究,以共同汇聚努力,从放射组学、遗传学、转录组学、蛋白质组学与代谢组学视角描绘动脉粥样硬化的多个层面。这对于构建准确的 AI 模型、对其进行验证并确保其泛化性至关重要。NIRF 与光子计数 CT 等新型临床成像模式、空间组学技术与血管生物力学,共同提供了前所未有的窗口,有望深入揭示驱动动脉粥样硬化的机制,以改进个体化患者诊断与治疗研发。

本章个人批注

本章由四位作者合写,主题鲜明:把前九章所述的转录组学工具(差异表达、scRNA-seq、空间转录组学、网络分析)真正用于临床患者分型与决策,所以侧重的是"研究设计 → 影像整合 → 多模态数据整合 → 临床应用 → 未来挑战"这条横向主线,与前几章纵向讲某类分子或某条通路不同。

研究设计一节(第一节到第六节)实际上是一份给临床转化研究者的 SOP——从目标/假说、样本选择、对照选择、动物模型取舍、RNA 质量控制到方法选型(bulk / sc / spatial)与生信流水线——所有这些都围绕"如何让转录组数据最终能被临床使用"。我特别注意到作者反复强调 RIN>5、链特异与 poly(A) 文库选择、批次效应校正(ComBat / RUV)以及 scRNA-seq 数据整合(bulk 反卷积用 BayesPrism / SCDC),这些都是工程化、可重复的关键点,不是泛泛之谈。

放射转录组学(第八到第十三节)是本章真正的新内容。前几章虽然提到影像与分子数据,但本章把放射组学的全流程(特征提取 → 选模 → 矩阵分解 / GNN / 深度学习 → 预测模型)与转录组数据对接的细节写了出来,并明确指出三大瓶颈:数据稀缺、放射组学软件灵敏度低且不可重复、模型可解释性差。CLEAR 清单、IBSI 标准化、联邦学习是应对的工程手段,但"数字孪生"则带一点展望色彩。

个人感兴趣的点:作者把 FAI(脂肪衰减指数)作为放射转录组学的范例——CT 影像 + 转录组信息,推断血管周围脂肪的炎症状态,这一思路与第 9 章所述的"动物与人类差异"形成有趣的呼应,因为 FAI 思路直接源于肿瘤领域的"无创取样分子签名",在动脉粥样硬化中则借助 CT 切片间接访问"分子信号"。这其实把转录组学从"必须切组织"解放出来,使其真正具备无创、可重复、患者友好的临床可行性。

与上下章的衔接（一段话）

本章位居全书的倒数第九章,正好是"方法 → 转化"的衔接:前几章(第 8 章的转录组方法、第 9 章的动物-人差距)已铺好方法论与跨物种可比性的底子,本章开始把方法论落地到临床患者分型、放射组学整合、决策工具。第 11 章承接本章的"患者分层"主题,聚焦于性别二态性;第 12 章承接"多组学整合",把转录组与蛋白质组、代谢组、表观遗传组放在同一框架下;第 13、14 章进一步引入基因调控网络与 AI/ML 方法,与本章末尾的放射转录组学、联邦学习形成前后呼应;第 15 章往后(RNA 治疗、递送、循环 RNA 生物标志物、展望)则把转录组学发现真正推入临床干预与诊断产品阶段。可以把本章看作"临床转化的入口":方法学已成熟,现在的问题是如何工程化、标准化、可重复地把数据送进临床决策。