跳转至

第一章:绪论(Introduction)

本章概述

本章作为《Transcriptomics in Atherosclerosis:Deciphering Molecular Signatures and Advancing Therapeutic Strategies》一书的开篇篇章,承担着奠定全书研究背景、阐述学科意义以及勾勒全书框架的重要使命。作者Miron Sopic与Yvan Devaux在章首即以震撼力的流行病学数据切入主题:动脉粥样硬化性心血管疾病(ASCVD)仍是全球范围内首要的致死病因,仅在欧洲每年便造成约四百万人死亡,占全部死因的百分之三十二;欧盟每年为此承担高达2820亿欧元的经济负担,其中医疗与长期护理支出为1550亿欧元。诸如此类的数据鲜明地揭示了心血管疾病对人类健康与社会经济造成的严峻挑战,也自然引出了本书何以聚焦于转录组学这一分子层面研究工具的深层逻辑。

从结构安排来看,本章并非对转录组学技术本身的深度技术性阐述,而是一篇立场鲜明的"宣言式"导论。作者意在阐明:尽管他汀类药物、PCSK9抑制剂等胆固醇降低疗法已取得显著进展,但患者在有效控制胆固醇水平后仍存在显著的残余风险,这一临床瓶颈促使研究界必须将目光投向炎症、甘油三酯、脂蛋白(a)[Lp(a)]等其他关键致病途径。转录组学正是解析这些复杂致病网络的利器——通过检测RNA的动态表达谱,研究者可实时捕捉细胞功能状态的分子快照,从而在系统层面理解动脉粥样硬化的发病机制并挖掘新的治疗靶点。

本章在全书中的定位相当于一幅"全景地图",依次展开三大核心叙事线索:其一,动脉粥样硬化的临床挑战与残余风险问题;其二,转录组学作为分子解析工具的独特优势与技术演进历程;其三,多组学整合策略与精准医学愿景之间的内在关联。阅读本章后,读者将对全书即将深入探讨的各个主题形成初步框架,并理解为何转录组学是理解动脉粥样硬化复杂性的不可替代的分子窗口。


关键问题与研究动机

本章围绕以下五个核心科学问题展开论述,这些问题构成本书各章节的共同学术坐标:

问题一:胆固醇降低治疗后残余风险的分子根源是什么? 作者指出,尽管他汀类药物、依折麦布和PCSK9抑制剂等胆固醇管理策略在临床上取得了突出成效,但接受最大剂量降脂治疗的患者仍面临显著的心血管事件复发风险。这一现象暗示胆固醇并非动脉粥样硬化的唯一驱动因素,炎症反应、脂蛋白代谢紊乱和免疫调节异常等同样扮演着关键角色。然而,这些残余风险的精确分子机制尚未被完全阐明,这正是转录组学研究的重要切入点。

问题二:非编码RNA在动脉粥样硬化中究竟发挥何种功能? 本章指出了一个颇具认识论意义的科学转折:早期RNA研究主要聚焦于编码蛋白质的外泌体mRNA,而人们现已认识到编码RNA仅占转录组的百分之二至百分之五——绝大多数转录产物为非编码RNA(ncRNA),其中包括微小RNA(miRNA)、长链非编码RNA(lncRNA)和环状RNA(circRNA)。这些曾经被误认为"垃圾RNA"的分子如今已被证实是基因表达调控和细胞功能调节的关键参与者,与动脉粥样硬化斑块的形成、进展和稳定性密切相关。理解这些非编码RNA的生物学功能,对于开发新型诊断标志物和治疗策略具有重要价值。

问题三:新一代测序技术如何革新动脉粥样硬化研究? 作者强调,下一代测序技术(NGS)的出现是转录组学研究中的里程碑式事件。传统方法往往受限于已知序列的探针杂交,而NGS实现了无偏倚、高分辨率的全基因组表达分析。进一步地,单细胞RNA测序(scRNA-seq)使研究者得以在单细胞层面解析斑块内细胞的异质性,识别驱动疾病进展的特定免疫细胞、内皮细胞和平滑肌细胞亚群。空间转录组学则更进一步,将基因表达信息与组织空间结构相整合,使研究者能够辨别稳定斑块与易损斑块之间在局部炎症、脂质代谢和细胞外基质重塑方面的空间差异。

问题四:如何从单一组学迈向多组学整合? 面对大规模转录组数据所带来的分析挑战,作者指出传统的统计方法已难以胜任多维度、高复杂性的数据集解析任务。机器学习(ML)和人工智能(AI)技术的引入为多组学数据的管理与深度挖掘提供了前所未有的可能性。通过将转录组学与基因组学、表观遗传学、蛋白质组学、代谢组学和影像学等多维度信息相整合,研究者可获得对动脉粥样硬化发病机制更为系统、更为全面的理解。

问题五:跨学科协作如何推动该领域进步? 作者特别强调了这一研究领域的内在跨学科属性——分子生物学家、生物信息学专家、机器学习工程师、临床心脏病学家和转化医学研究者之间的紧密合作是推动该领域取得实质性进展的必由之路。本书正是由COST行动中的CardioRNA和AtheroNET两个研究网络联合全球顶尖专家共同编撰的产物,体现了欧盟"地平线2020"和"地平线欧洲"框架下推动跨学科合作的战略意图。

从更宏观的视角来看,本章所传递的核心研究动机在于:动脉粥样硬化性心血管疾病的全因负担仍然巨大,而现有治疗手段的局限性呼唤着更具针对性的分子层面干预策略。转录组学凭借其捕捉细胞状态动态变化的独特能力,有潜力为精准医学时代的心血管健康管理提供全新的研究范式和临床工具。


主要技术与方法框架

本章虽然以概念性论述为主,但在技术方法层面仍然勾勒出了清晰的三代转录组学技术演进路线图,并对多组学整合策略所依赖的计算框架进行了初步说明。

三代转录组学技术的演进逻辑

第一代技术以RNA测序(RNA-seq)为基础,依托NGS平台实现了对全基因组转录本的定量分析。与此前基于芯片的基因表达分析不同,RNA-seq无需预先设计探针,能够检测新的转录本、可变剪接事件和基因融合现象,因此在发现未知分子层面具有显著优势。作者指出,NGS的核心优势在于"无偏倚"(unbiased)特性——它不依赖预先设定的基因列表,从而允许研究者以开放视角探索动脉粥样硬化进程中的全新分子参与者。

第二代技术——单细胞RNA测序(scRNA-seq)的引入标志着转录组学从"批量平均"向"单细胞精度"的技术飞跃。动脉粥样硬化斑块本质上是多种细胞类型的复杂混合体,包括巨噬细胞、T细胞、内皮细胞、平滑肌细胞、成纤维细胞等。传统的批量RNA-seq只能给出所有细胞基因表达的平均值,掩盖了细胞间的异质性。scRNA-seq通过微流控或微孔板技术分离并独立标记每个细胞的RNA,再进行建库测序,使得研究者可以绘制出斑块内细胞类型的详细"地图",识别驱动疾病进展的关键细胞亚群及其特异性的转录程序。

第三代空间转录组学(spatial transcriptomics)则在scRNA-seq的基础上进一步引入了空间位置信息。其技术原理通常是在组织切片上铺设带有唯一分子标签(UMI)的捕获探针阵列,使每个空间像素点都能对应到特定的组织位置。通过将基因表达矩阵与空间坐标相叠加,研究者可以直接观察特定基因在斑块内的空间表达梯度,识别出炎症富集区域、脂质核心区域和纤维帽区域等在空间上相互分离的功能模块。这种空间解析能力对于理解斑块微环境中细胞间通讯的物理布局具有变革性意义。

多组学整合的计算框架

作者在讨论多组学整合时,并未深入展开具体算法细节,但指出了这一方向的核心挑战与机遇:大数据复杂性的管理需要借助机器学习和人工智能方法。在多组学框架下,数据的异质性(基因组数据为离散变异、蛋白质组学数据为定量表达、影像学数据为高维像素矩阵)和跨尺度关联(分子层面的调控与组织层面的病理形态如何对应)构成了主要的方法论挑战。当前常用的整合策略包括早期整合(将原始数据拼接后联合建模)、中间整合(在各组学分别提取特征后再进行融合)和晚期整合(各组学独立建模后进行决策级融合)等不同层次的技术路线。此外,基因调控网络(GRN)的构建和系统生物学的建模方法(如布尔网络、概率图模型等)也为从多组学数据中提取生物学意义提供了理论框架。


主要结论

本章的核心结论可概括为以下五个层面:

第一,动脉粥样硬化性心血管疾病构成全球首要死亡原因,其社会经济负担极为沉重,但现有以胆固醇为中心的治疗范式存在难以忽视的残余风险,这一残余风险构成了本书研究的核心临床动因。作者援引Eurostat 2025年统计数据和欧洲心脏病学会2023年大会报告,以量化方式强化了这一论断的可信度。

第二,非编码RNA在动脉粥样硬化中的角色已从"垃圾RNA"的误解中解放出来,成为基因表达调控网络中的关键节点。miRNA、lncRNA和circRNA等非编码RNA已被证实参与调控斑块的形成、进展与稳定性丧失等核心病理过程,代表着极具潜力的治疗靶点和生物标志物来源。

第三,以NGS、scRNA-seq和空间转录组学为代表的新一代转录组技术已经并将持续改变动脉粥样硬化研究的方法论格局。这些技术从不同维度——全基因组覆盖、单细胞精度和空间分辨率——拓展了研究者的认知边界,使以往不可能观察到的分子现象得以被系统性地记录和分析。

第四,多组学整合策略为理解动脉粥样硬化的复杂发病机制提供了系统论框架。通过将转录组学与基因组学、表观遗传学、蛋白质组学、代谢组学和影像学等多维度数据相融合,研究者可构建从基因变异到代谢表型、从分子调控到组织病理的多尺度疾病模型,从而为精准医学的实现奠定数据基础。

第五,本书的编撰体现了跨学科协同研究的战略价值。来自不同专业背景的研究者——分子生物学家、生物信息学专家、临床医学家——通过COST行动网络的组织形式实现知识整合,代表了当代生物医学研究从"单一学科深耕"向"跨学科协同攻关"转型的总体趋势。


挑战与开放问题

尽管本章以乐观的展望收尾,但在字里行间仍可辨识出该领域面临的多重挑战与尚未解决的科学问题:

挑战一:从观察到干预的转化鸿沟。 当前scRNA-seq和空间转录组学等技术的主要贡献仍停留在"描述性发现"层面——它们帮助研究者识别出哪些细胞类型、哪些基因表达程序与疾病状态相关联,但如何将这些分子发现转化为可干预的治疗靶点,仍是一个远未解决的难题。动脉粥样硬化涉及数十年慢性进程,斑块微环境的复杂性和个体差异性使得从体外研究发现到体内治疗验证之间的路径充满不确定性。

挑战二:多组学数据的标准化与可重复性问题。 不同研究团队使用的测序平台、样本处理流程、数据分析 pipeline 存在显著差异,这导致跨研究队列的数据可比性受到制约。特别是在机器学习模型的训练与验证中,数据批次效应和过拟合风险是需要严肃对待的方法论挑战。作者虽然强调了AI/ML在多组学分析中的价值,但并未深入讨论模型可解释性和临床可推广性等关键问题。

挑战三:非编码RNA的功能注释仍不完整。 尽管非编码RNA的重要性已得到广泛认可,但绝大多数lncRNA和circRNA的生物学功能尚未被系统解析。以lncRNA为例,其分子机制往往涉及复杂的空间折叠结构、多种RNA结合蛋白的协同结合以及作为"海绵"吸附miRNA的多重功能,这些特性使得传统的一基因一功能的研究范式难以有效捕捉其全貌。

挑战四:空间转录组学的技术瓶颈。 当前空间转录组学技术的空间分辨率(通常为55至100微米级别)尚未达到单细胞级别,意味着每个空间像素可能混合了多个细胞的RNA信号。此外,组织切片制备过程中的RNA降解和空间位置伪影也是不容忽视的技术噪声来源。

挑战五:精准医学愿景的可及性与公平性。 个体化治疗策略的美好愿景面临着高昂的检测成本和临床实施门槛的严峻考验。在医疗资源分配不均的现实背景下,如何确保转录组学驱动的精准医学成果能够惠及更广泛的心血管疾病患者群体,而非仅限于发达国家的高收入人群,是一个需要正视的伦理与社会学问题。


个人评析与批判性思考

本章作为一本书的导论,在有限篇幅内完成了多重叙事任务——从流行病学数据的宏观叙事,到分子技术的微观解读,再到跨学科协作的组织哲学——其信息密度和逻辑组织均值得肯定。然而,从批判性视角审视,仍有以下几点值得进一步探讨。

关于研究动机的设定: 作者将胆固醇降低治疗后的残余风险作为核心临床痛点来铺垫转录组学的必要性,这一逻辑链条虽然清晰,但可能过于简化了动脉粥样硬化病理生理学的复杂性。实际上,炎症在动脉粥样硬化中的致病作用已有数十年研究历史,CANTOS和COLCOT等临床试验也提供了靶向炎症治疗心血管事件的初步循证依据。将转录组学定位为解决残余风险的"银弹",可能会在无形中抬高读者对单一技术手段的期望值,而忽视了综合性生活方式干预和传统药物治疗的持续价值。

关于非编码RNA的过度"炒作"风险: 作者在文中对ncRNA的描述充满溢美之词——"曾经被误认为垃圾RNA,现在被理解为关键调控因子"。然而,从严谨的科学视角来看,大多数ncRNA的功能验证仍停留在相关性层面,真正在动物模型中验证其因果作用并推进到临床试验阶段的工作仍然稀缺。将"垃圾RNA"到"关键调控者"的叙事过于一边倒,可能不利于读者建立对ncRNA研究现状的客观认知。

关于技术描述的深度不足: 作为一本专业书籍的导论,本章对NGS、scRNA-seq和空间转录组学的技术原理仅做了蜻蜓点水式的介绍,未能交代各种技术的关键参数(如测序深度、捕获效率、灵敏度下限等),也未讨论不同商业化平台(如10x Genomics、Illumina、nanopore等)之间的技术路线差异和各自优劣势。对于希望快速评估这些技术适用性的读者而言,这些信息遗憾地缺位于本章之中。

本书结构的战略亮点: 值得肯定的是,作者在介绍全书结构时展现了对动脉粥样硬化复杂性的系统认知。六个主题板块的设置(从流行病学到RNA生物学、从技术方法到多组学整合、从治疗应用到未来展望)遵循了从宏观到微观、从基础到转化的递进逻辑。特别是第五板块聚焦于RNA治疗策略和循环RNA生物标志物,体现了基础研究向临床应用延伸的务实取向。

值得深入阅读的方向: 基于本章所铺设的知识框架,读者可重点关注后续章节中以下内容:scRNA-seq数据在解析斑块免疫微环境中的具体应用案例、空间转录组学在区分易损斑块与稳定斑块中的判别效能评估、以及多组学整合在识别新型心血管风险标志物方面的实际战绩。这些内容将检验本章所勾勒的美好愿景在实践中究竟能兑现至何种程度。


公式汇总

本章以概念性论述为主,涉及的数学公式和定量模型较少,但以下列出了本章提及或隐含的关键数量关系和统计指标:

# 名称 形式 物理意义 类型
(1.1) ASCVD死亡占比 \(32\%\) 动脉粥样硬化性心血管疾病占欧洲全部死因的比例 (E)
(1.2) CVD经济负担 €2820亿 欧盟每年心血管疾病导致的总经济损失 (E)
(1.3) 医疗支出占比 €1550亿(占总负担的55%) 心血管疾病相关医疗与长期护理支出 (E)
(1.4) 编码RNA占比 \(2\%-5\%\) 蛋白质编码mRNA占整个人类转录组的比例 (E)
(1.5) 非编码RNA占比 \(>90\%\) 非编码RNA占整个人类转录组的比例 (E)

注:(T)=理论推导公式,(E)=经验统计数据


参考文献

[1] Eurostat. Cardiovascular diseases statistics. Statistics Explained. 2025 [cited 2025 Jul 15]. https://ec.europa.eu/eurostat/statistics-explained/index.php?title=Cardiovascular_diseases_statistics

[2] ESC Congress 2023 – economic burden of CVD in the EU [Internet]. HealthManagement.org; 2025 [cited 2025 Sep 1]. https://healthmanagement.org/c/cardio/news/esccongress2023-economic-burden-of-cvd-in-the-eu