第九章:弥合转录组学中的鸿沟——从动物模型到人类研究的转化
书名:Transcriptomics in Atherosclerosis(转录组学与动脉粥样硬化) 作者:Loredan Stefan Niculescu and Dimitris Kardassis 出版社:Elsevier 出版年份:2026年 章节:第九章(Bridging the Gap in Transcriptomics: From Animal to Human Studies in Atherosclerosis)
第一节 章节概述
本章由Loredan Stefan Niculescu和Dimitris Kardassis撰写,主要探讨了转录组学技术在动物动脉粥样硬化模型中的应用,以及将这些研究成果转化至人类临床研究的桥梁问题。作者首先回顾了动物模型在动脉粥样硬化研究中的历史地位,指出兔子是最早用于该领域研究的动物,随后是小鼠等啮齿类动物。1990年代初是动物动脉粥样硬化研究的"大爆炸"时期,伴随着载脂蛋白E(apoE)基因和低密度脂蛋白受体(LDLr)基因敲除小鼠的诞生,转录组学、蛋白质组学、脂质组学和代谢组学等高通量技术也同步迅猛发展,为发现新的生物标志物和疾病相关基因提供了前所未有的机遇。
本章系统性地综述了多种动物模型(小鼠、大鼠、兔子、仓鼠、斑马鱼和猪)的转录组学研究进展,重点介绍了每种模型的优缺点、遗传背景、饮食干预方法以及在动脉粥样硬化研究中取得的主要发现。作者在章节末尾明确指出了动物模型向人类研究转化过程中面临的核心挑战,包括小鼠基因组注释不完整、非编码RNA物种在物种间保守性低、斑块组成和结构异质性大以及斑块破裂模型缺乏等问题。这一章节在全书中起到了重要的桥梁作用,连接了基础实验科学和临床转化医学两个层面。
第二节 关键问题与研究动机
动脉粥样硬化(Atherosclerosis,AS)作为一种慢性进展性心血管疾病,其发病机制涉及脂质代谢紊乱、炎症反应、血管壁细胞行为改变等多层面生物学过程。理解这些复杂相互作用的传统方法效率低下,而动物模型结合高通量组学技术为研究这一问题提供了全新范式。本章节聚焦于以下几个核心科学问题。
第一,如何利用转录组学技术在动物模型中识别与动脉粥样硬化发生发展相关的关键基因和信号通路?已有的研究表明,通过RNA测序(RNA-seq)和单细胞RNA测序(scRNA-seq)等技术,研究者能够在全基因组层面定量分析细胞转录活性,从而鉴定出参与疾病过程的核心分子。
第二,不同物种的动物模型在模拟人类动脉粥样硬化表型方面各有什么优势和局限性?小鼠由于遗传操作简便、繁殖周期短而成为主流模型,但其天然抗动脉粥样硬化的脂蛋白谱(高HDL、低LDL/VLDL)要求通过基因工程或饮食干预来诱导疾病表型。大鼠体型较大但遗传操作困难,兔子动脉粥样硬化进展迅速但遗传工程挑战较大,仓鼠脂质代谢接近人类但基因组数据有限,斑马鱼适合快速筛选但心血管解剖结构差异显著,猪的心血管系统最接近人类但成本高昂且诱导晚期斑块困难。
第三,也是最为关键的问题:动物模型与人类之间存在怎样的转录组学差异?如何在动物实验数据与人类临床观察之间建立可靠的对应关系?HOSTMAN等人在人类颈动脉斑块中发现T细胞系占主导地位,而将人类数据与7个独立的小鼠单细胞RNA-seq数据集进行生物信息学整合后,共识别出51种细胞类型和分化状态,其中部分细胞类型在小鼠和人类之间差异显著,提示标准小鼠模型在适应性免疫细胞研究中的翻译价值存在重大局限。这些发现构成了本章的核心研究动机——必须承认现有动物模型的局限性,并积极开发更接近人类生理病理状态的新型在体模型。
第三节 主要技术与方法学框架
虽然本章以综述性论述为主而非公式驱动的理论章节,但作者系统性地描述了转录组学技术的原理框架和关键实验设计要素。
3.1 主要转录组学技术平台
RNA测序(RNA-seq):作为全转录组分析的金标准方法,RNA-seq能够无偏倚地检测样本中几乎所有RNA转录本,包括mRNA和非编码RNA(lncRNA、circRNA、miRNA等)。在本章报道的研究中,RNA-seq被广泛应用于比较不同饮食条件、不同基因型小鼠之间以及动物与人类斑块之间的基因表达差异。RNA-seq的关键优势在于其定量动态范围宽、可检测新转录本和可变剪接变体,且不依赖于预设的探针阵列。
单细胞RNA测序(scRNA-seq):该技术突破了传统批量测序(bulk RNA-seq)的平均化效应,能够解析组织内异质细胞群体的独立转录特征。在动脉粥样硬化研究中,scRNA-seq已被用于绘制主动脉免疫细胞图谱、鉴定内皮细胞向间质细胞转化(EndMT)过程、区分斑块中泡沫细胞与非泡沫巨噬细胞的转录组差异等。ZHAO等人在糖尿病动脉粥样硬化模型中利用scRNA-seq揭示了KLF11缺失促进EndMT的分子机制,这是传统批量测序难以发现的精细生物学过程。
微阵列芯片(Microarray):尽管近年来逐渐被RNA-seq取代,微阵列技术在历史数据集的二次挖掘中仍具有重要价值。YANG等人通过生物信息学方法重新分析了apoE−/−小鼠中已有的表达谱芯片数据,识别出96个早期与晚期斑块之间的差异表达基因(DEGs)以及838个稳定斑块与破裂斑块之间的DEGs,为理解斑块进展和破裂的分子基础提供了系统性的回顾性洞察。
3.2 差异表达基因分析框架
差异表达基因(Differentially Expressed Genes,DEGs)的鉴定是几乎所有转录组学研究的起点。典型分析流程包括数据质控、序列比对、定量标准化和统计检验。批量RNA-seq中常用的DESeq2和edgeR等工具基于负二项分布模型处理计数数据,而scRNA-seq则需要考虑 dropout 现象和批次效应等特殊挑战。在统计分析层面,通常采用Benjamini-Hochberg方法对p值进行多重假设检验校正以控制假发现率(FDR),差异表达的标准通常设定为校正后p值小于0.05且基因表达量变化倍数(Fold Change)不低于2倍。
3.3 富集分析和方法
KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析和Gene Ontology(GO)基因本体论分析是本章中多次出现的功能性注释工具。KEGG分析将DEGs映射到已知的代谢和信号通路网络中,从而识别出在特定生物学过程或疾病状态下显著活跃的通路网络。例如,YANG等人的研究发现,在进展期斑块和破裂斑块之间重叠的29个DEGs富集于趋化因子信号通路和金黄色葡萄球菌感染通路,提示这些通路可能同时参与斑块进展和稳定性调控。
此外,本章还涉及竞争性内源RNA(ceRNA)网络的构建方法,即基于lncRNA-miRNA-mRNA的三角关系网络。在兔动脉粥样硬化模型中,研究者构建了差异表达circRNA-miRNA-mRNA三元网络,发现网络中的基因参与细胞黏附、细胞活化和免疫应答等关键生物学过程。
3.4 关键参数与模型设计要素
在动物模型研究中,几个关键参数对转录组学实验的结果解读至关重要。饮食干预方面,高脂饮食(HF Diet)或西方类型饮食(Western Diet)的成分和喂食时长直接影响动脉粥样硬化表型的严重程度和类型。遗传背景方面,纯合基因敲除(LDLr−/−、apoE−/−)与双敲除或转基因小鼠的组合可产生协同或修饰效应。时间维度方面,研究设计需覆盖疾病的不同阶段——从早期脂质条纹到晚期纤维斑块乃至斑块破裂——因为同一基因在不同疾病阶段可能呈现截然不同的表达模式。
第四节 动物模型转录组学研究的主要发现
本节按照物种分类系统梳理了各类动物模型中的代表性转录组学研究发现。
4.1 小鼠模型(Mus musculus)
小鼠是动脉粥样硬化转录组学研究中应用最广泛的物种,其中LDLr−/−和apoE−/−两种模型占据绝对主导地位。
在LDLr−/−模型中,HWANG等人研究了维生素D对高脂饮食条件下T细胞分化和信号转导通路的影响,发现JAK-STAT、HIF-1和钙信号通路存在显著差异,而1,25(OH)2D3处理可抑制MAPKKK信号通路并显著减少Th1细胞比例,提示维生素D在动脉粥样硬化中具有抗炎作用。ZHAO等人利用scRNA-seq对糖尿病动脉粥样硬化中的内皮细胞进行深入分析,发现KLF11基因缺失加速动脉粥样硬化,而KLF11过表达则抑制疾病进展,其机制涉及内皮细胞向间质细胞转化(EndMT)的调控。SCHAFER等人通过scRNA-seq揭示了CD8+ T细胞在晚期斑块中驱动平滑肌细胞(SMC)去分化的作用,发现CD8+ T细胞耗竭可增加主动脉SMC中收缩基因的表达特征,为以SMC为靶点稳定斑块提供了新思路。HERNANDEZ等人则探索了父代高胆固醇血症对子代动脉粥样硬化的跨代遗传效应,发现父代高胆固醇通过改变精子tsRNA/rsRNA谱系诱导子代主动脉中促动脉粥样硬化基因(如Ccn1和Ccn2)的表达,揭示了表观遗传跨代传递的新机制。
在apoE−/−模型中,ZHANG等人结合单细胞和批量RNA-seq技术,发现高脂饮食组小鼠主动脉中单核细胞/巨噬细胞比例显著升高,而T细胞、成纤维细胞和B细胞比例下降,细胞间相互作用增强,并证实FSCN1基因敲低可抑制动脉粥样硬化进展。CHEN等人利用scRNA-seq在apoE−/−小鼠中鉴定出一类新型"不健康脂肪组织巨噬细胞"(ATMs),发现CD36缺陷通过促进脂质相关巨噬细胞(LAM)积累来减少白色脂肪组织炎症并增加脂质代谢。GUTIERREZ等人发现Annexin A8(AnxA8)是apoE−/−小鼠主动脉中上调最显著的基因之一,并在人类斑块中得到验证,确认AnxA8通过调控内皮细胞-白细胞相互作用促进动脉粥样硬化进展。KIM等人则详细比较了泡沫巨噬细胞和非泡沫巨噬细胞的转录组,发现泡沫巨噬细胞中胆固醇外排和吞噬相关基因(如Cd36、Mertk、Nr1h3)表达升高,而促炎基因(如Ccl2、Ccr2、Abca7)表达下降,表明巨噬细胞根据脂质含量呈现显著不同的转录组学特征。
4.2 大鼠模型(Rattus norvegicus)
大鼠相比小鼠体型更大,更适合某些外科手术干预研究,但遗传操作难度较高。通过锌指核酸酶技术已成功构建LDLr−/−和apoE−/−大鼠模型,这些大鼠在Paigen饮食诱导下分别于50周和64周后发展出广泛动脉粥样硬化。YANG等人利用大鼠中脑动脉闭塞模型构建了与动脉粥样硬化性缺血性脑卒中相关的circRNA-lncRNA-miRNA-mRNA调控网络,为理解心脑血管共病提供了新的转录组学视角。
4.3 兔子模型(Oryctolagus cuniculus)
兔子动脉粥样硬化进展迅速,其部分原因在于肝脏缺乏apoB mRNA编辑活性。野生型和Watanabe遗传性高脂血症(WHHL)兔子均可形成主动脉和冠状动脉斑块,组织学特征包括显著的内膜增厚、泡沫细胞和纤维化成分,与人类病变具有较高的相似性。转录组学分析在兔子模型中主要聚焦于lncRNA和miRNA调控网络。ZHANG等人通过RNA-seq构建了差异表达circRNA-miRNA-mRNA三元网络,发现网络中的基因富集于细胞黏附、细胞活化和免疫应答通路。WU等人则在颈动脉粥样硬化兔子模型中生成了基于ceRNA机制的三元互作网络,为识别新的预后生物标志物提供了候选分子。
4.4 仓鼠模型(Mesocricetus auratus)
金黄叙利亚仓鼠的脂质代谢与人类高度相似——具有CETP活性、完整的PPAR系统以及与人类相同的脂蛋白和胆汁酸代谢酶系。更为重要的是,仓鼠与人类在性别相关的脂质代谢敏感性上相似,即雄性对致动脉粥样硬化饮食更敏感。高脂饮食可损害仓鼠的逆向胆固醇转运(RCT)并增加CETP活性。然而,仓鼠基因组数据相对匮乏,限制了其转录组学研究的深度。BARBALATA等人利用miRNA微阵列在喂食高脂饮食的高脂血症仓鼠的心脏-肝脏轴组织中发现了差异表达的miRNA,为跨组织代谢调控研究提供了线索。
4.5 斑马鱼模型(Danio rerio)
斑马鱼因体型小、繁殖快、胚胎透明和体外受精等优点成为研究高脂血症和动脉粥样硬化的经济高效模型。通过高胆固醇饮食诱导、LDLR突变、APOC2突变和LXR突变等方法已建立了多种斑马鱼动脉粥样硬化模型。KA等人报道了喂食高脂饮食的斑马鱼肝脏转录组谱的变化,发现斑马鱼中高脂饮食上调的基因与人类高脂血症已知风险因素基因有部分重叠,但斑马鱼肝脏转录组与小鼠之间的相似性有限。尽管如此,斑马鱼模型在筛选参与脂质代谢调控的新基因和化合物方面仍具有独特优势。
4.6 猪模型(Sus scrofa)
猪的心血管系统解剖结构和生理功能与人类高度接近,是最具临床转化潜力的大型动物模型。通过PCSK9功能获得性突变、apoE基因敲除和LDLR基因敲除等遗传操作,结合高胆固醇高脂肪(HCHF)饮食,已成功构建了多种猪动脉粥样硬化模型。HAEMMIG等人在高胆固醇血症约克郡猪和糖尿病-高胆固醇血症猪的冠状动脉节段进行了病灶RNA-seq分析,报道了进化上保守的基因特征和信号通路在不同疾病阶段呈动态变化,且糖尿病相关和非糖尿病相关动脉粥样硬化之间存在可区分的转录组学特征,为精准医学框架下的动脉粥样硬化分期分型提供了分子依据。
第五节 主要结论与核心发现
综合本章报道的大量动物模型转录组学研究,可以提炼出以下几个核心结论。
第一,小鼠仍然是动脉粥样硬化转录组学研究的主力模型。apoE−/−和LDLr−/−小鼠在揭示动脉粥样硬化发病机制、筛选关键基因和通路、测试干预策略等方面做出了不可替代的贡献。特别是scRNA-seq技术的应用,使得研究者能够以单细胞分辨率解析斑块微环境中免疫细胞、平滑肌细胞和内皮细胞的异质性和动态变化,发现了一批具有治疗潜力的新靶点,如FSCN1、KLF11、AnxA8等。
第二,不同物种模型各有其独特的转录组学特征和适用范围。兔子模型在快速诱导冠状动脉病变方面具有优势,其lncRNA和miRNA网络研究为寻找循环生物标志物提供了候选分子。仓鼠模型在脂质代谢调控机制方面与人类高度相似,为研究HDL功能和CETP抑制剂效应提供了独特平台。斑马鱼模型尽管与哺乳动物存在进化距离,但在胚胎发育期间的心血管表型筛选中具有高通量优势。猪模型在模拟人类晚期冠状动脉斑块方面最为接近,但其成本高昂、实验周期长限制了大规模应用。
第三,动物模型向人类研究的转化面临重大挑战。最突出的问题是物种间免疫细胞组成和状态的差异。HOSTMAN等人的跨物种单细胞分析表明,小鼠和人类颈动脉斑块中的适应性免疫细胞存在实质性差异,约一半的细胞类型和分化状态仅在人类中特异性地出现。此外,小鼠基因组注释不完整、非编码RNA保守性低以及斑块异质性大等问题,均制约了动物研究结果的直接临床转化。
第四,新一代测序技术和生物信息学方法的整合应用正在改变动脉粥样硬化研究的范式。从传统的批量RNA-seq到scRNA-seq,从单一组学分析到多组学联合分析(lncRNA-miRNA-mRNA ceRNA网络、circRNA-miRNA-mRNA三元网络),从描述性研究到功能验证研究,转录组学技术的进步使得研究者能够在系统层面理解动脉粥样硬化的复杂调控网络。
第六节 挑战与开放问题
尽管动物模型转录组学研究取得了丰硕成果,本章揭示了该领域面临的多个核心挑战和尚未解决的关键问题。
6.1 物种间转录组学保守性的根本性限制
小鼠与人类之间在基因组和转录组层面的保守性并不如预期的那样高。GENCODE项目的数据显示,小鼠基因组尚未被完全注释,这意味着可能存在大量未被识别的基因和转录变体。更关键的是,长链非编码RNA(lncRNA)等表观遗传调控因子在小鼠和人类之间的序列保守性普遍较低,且lncRNA在小鼠中的表达水平通常低于人类。这些差异使得在小鼠模型中发现的疾病相关lncRNA难以直接对应到人类疾病,构成了转化医学的重大障碍。
6.2 斑块组成与破裂表型的模拟不足
动脉粥样硬化的最严重临床后果——斑块破裂和血栓形成——在大多数小鼠模型中难以重现。虽然apoE−/−小鼠在臂头动脉和主动脉中可出现罕见的斑块破裂,但典型的冠状动脉血栓性闭塞和心肌梗死在这些模型中基本不存在。这种表型差异意味着,通过小鼠转录组学研究所揭示的参与"斑块破裂"的分子机制,实际上是在非典型解剖部位和稀有事件背景下观察到的,其临床相关性有待商榷。
6.3 单细胞时代的批次效应与数据整合挑战
scRNA-seq技术的广泛采用带来了新的方法学挑战。不同实验室、不同平台、不同样本处理流程产生的scRNA-seq数据存在显著的批次效应,如何有效整合多个跨物种、跨研究的数据集是一个尚未完全解决的技术难题。HOSTMAN等人的研究尝试将人类颈动脉斑块scRNA-seq数据与7个独立的小鼠数据集进行整合分析,发现了51种细胞类型,这种跨物种、跨研究的整合策略具有重要方法学示范意义,但如何标准化数据质量、控制批次效应并正确解释生物学差异仍需进一步的方法学创新。
6.4 动态疾病过程的时间分辨率不足
大多数转录组学研究采用的是静态snapshot设计,即在特定时间点收集样本进行测序分析。动脉粥样硬化作为一种慢性进展性疾病,其分子调控网络在整个疾病发展过程中持续动态变化。现有研究在捕捉这些动态变化轨迹方面能力有限,纵向转录组学研究(在同一动物个体中追踪不同疾病阶段的转录组变化)仍然稀缺。
6.5 功能验证的滞后性
转录组学技术的进步使得大规模筛选差异表达基因成为常规操作,但这些基因的功能验证往往滞后于表达谱分析。在本章报道的研究中,仅有少部分DEGs得到了后续的机制研究验证(如KLF11、FSCN1、AnxA8、CD8+ T细胞等),大量候选基因的生物学功能和因果关系仍不明确。这种"发现快、验证慢"的现状制约了转录组学发现向临床应用的有效转化。
6.6 大型动物模型资源建设的迫切需求
猪和非人灵长类等大型动物模型虽然在心血管解剖和生理上更接近人类,但目前可用的遗传修饰品系数量有限,基因组注释质量也不如小鼠完善。开发更多遗传修饰的微型猪品系、建立标准化的猪动脉粥样硬化转录组学数据库,是缩小动物模型与人类疾病差距的重要基础设施任务。
第七节 个人思考与批判性分析
从批判性视角审视,本章内容在多个层面对读者具有深刻的启示意义。
7.1 对"动物模型至上"范式的反思
长期以来,动物模型被视为理解人类疾病的黄金标准,而本章以扎实的实验数据揭示了这一范式的局限性。小鼠作为最常用的动脉粥样硬化模型,其天然抵抗动脉粥样硬化的脂蛋白谱要求通过基因工程人为改变其代谢表型,这一事实本身就说明小鼠并非研究动脉粥样硬化的"自然"模型。更值得关注的是,即使用基因敲除手段强行诱导疾病表型,小鼠与人类在免疫细胞组成、非编码RNA表达、斑块解剖分布和临床结局等关键方面仍存在根本差异。这提醒我们,动物模型的价值在于提供机制探索的平台,而非人类疾病的直接镜像。
7.2 多组学整合方法的认识论价值
本章揭示的一个重要趋势是,从单一的批量RNA-seq向scRNA-seq、多组学联合分析的范式转变。批量RNA-seq提供的是组织整体的平均信号,可能掩盖了稀有细胞类型的独特转录特征和细胞间对话的精细调控。scRNA-seq则打开了细胞异质性的黑箱,使得研究者能够追问"哪些细胞在表达疾病相关基因"这一更为精确的生物学问题。ceRNA网络和circRNA-miRNA-mRNA三元网络的构建则体现了系统生物学的思维——将基因视为动态调控网络中的节点而非孤立的功能单元,而非线性的因果链条。这种从还原论到系统论的思维转变,对于理解动脉粥样硬化这类多因素、多层次、多阶段互作的复杂疾病尤为关键。
7.3 跨物种比较的方法学启示
HOSTMAN等人的跨物种单细胞RNA-seq整合研究是本章最具方法论创新性的工作之一。他们没有将人类和小鼠数据视为互相独立的信息来源,而是主动寻找二者的交集和差异,从而揭示了小鼠模型在适应性免疫细胞研究中的翻译局限性。这种跨物种比较的思路值得推广:在设计任何动物实验之前,研究者应首先系统评估目标生物学过程在所选物种和人类之间的保守程度,而非默认小鼠是最好的疾病模型。这一思路实际上呼应了转化医学中"逆向转化"(reverse translation)的理念——从人类临床观察到动物模型验证,再回到临床应用的双向路径。
7.4 表观遗传跨代传递的新视野
HERNANDEZ等人关于父代高胆固醇血症通过精子tsRNA/rrRNA谱系改变影响子代动脉粥样硬化易感性的研究,为动脉粥样硬化的病因学开辟了全新的维度。这一发现超越了传统的遗传学框架(DNA序列变异)和环境因素框架(饮食、运动),指向了第三种传递机制——表观遗传信息的跨代继承。如果这一机制在人类中得到证实,则意味着一个人的心血管健康可能部分地由其父母的代谢记忆所塑造,这将深刻改变我们对动脉粥样硬化风险评估和预防策略的认知。当然,从小鼠到人类的跨代表观遗传传递是否真实存在,仍需更多独立研究的验证。
7.5 关于研究策略的思考
读完本章,一个值得深思的问题是:在资源有限的前提下,应优先发展哪类动物模型?小鼠因其成本低、遗传操作成熟而具有不可替代的优势,但其在模拟人类疾病关键表型(尤其是斑块破裂)方面的固有缺陷限制了其转化价值。猪模型在解剖学和病理学上更接近人类,但成本高昂、实验周期长。大动物模型和小型模式动物的结合使用——例如用小鼠进行候选基因筛选和机制探索,用猪模型进行临床前验证——可能是更为务实的策略。此外,人类斑块样本的直接转录组学分析应与动物模型研究并重,而非仅作为动物发现的"验证集"。毕竟,最终的治疗目标是人类患者,而非任何动物模型。
7.6 未来方向的展望
展望未来,以下几个方向有望推动动物-人类转录组学鸿沟的弥合:一是构建高质量的跨物种、跨疾病阶段的动脉粥样硬化转录组学参考图谱(Reference Atlas),类似于肿瘤领域中的TCGA和GTEx计划;二是发展更接近人类病理生理的大型动物模型,特别是基因编辑技术快速发展的背景下,精准构建携带人类动脉粥样硬化相关基因突变或变体的猪模型;三是推进单细胞多组学技术(scRNA-seq联合scATAC-seq、scProteomics等)在动脉粥样硬化研究中的应用,从转录组单一维度向多维度表观遗传调控网络拓展;四是加强临床数据与基础研究数据的双向对接,建立以患者为中心的动脉粥样硬化多组学数据库,实现从"动物到人类"的单向转化向"动物↔人类"双向迭代的范式升级。
公式汇总
本章以综述性内容为主,涉及的分析方法多基于统计学模型而非解析公式。以下列出主要分析框架中的关键量化和建模概念。
| # | 名称 | 形式 | 物理意义 | 类型 |
|---|---|---|---|---|
| (9.1) | 差异表达倍数 | \(\text{FC} = \frac{\text{表达量}_{\text{处理组}}}{\text{表达量}_{\text{对照组}}\) | 基因表达量在两组间的变化倍率 | (E) |
| (9.2) | 负二项分布模型(RNA-seq计数数据) | \(Y_i \sim \text{NB}(\mu_i, \sigma_i^2)\) | 描述RNA-seq计数数据的离散分布 | (T) |
| (9.3) | Benjamini-Hochberg校正 | \(p_{\text{adj}} = p \times \frac{m}{k}\) | 多重假设检验的假发现率控制 | (T) |
| (9.4) | KEGG通路富集分析 | \(\text{P-value} = 1 - \sum_{i=0}^{k-1} \frac{\binom{K}{i}\binom{M-K}{n-i}}{\binom{M}{n}\) | 识别差异基因富集的统计学通路 | (E) |
| (9.5) | ceRNA网络三角关系 | \(\text{lncRNA} \uparrow \rightarrow \text{miRNA} \downarrow \rightarrow \text{mRNA} \uparrow\) | lncRNA作为miRNA"海绵"间接上调mRNA | (T) |
| (9.6) | 单细胞UMAP降维 | \(\mathbf{Z} = f(\mathbf{X}_{\text{genes}} \times \mathbf{W})\) | 将高维单细胞表达谱投射至低维空间进行可视化聚类 | (T) |
| (9.7) | EndMT转化评分 | \(\text{Score}_{\text{EndMT}} = \sum_{i \in \text{EndMT genes}} \frac{\text{expr}(i)}{\text{expr}_{\text{max}}(i)}\) | 内皮细胞向间质细胞转化程度的量化指标 | (E) |
注:(T)= 理论推导模型;(E)= 经验公式或统计分析框架。
关键术语中英对照
- 转录组学(Transcriptomics)
- 动脉粥样硬化(Atherosclerosis,AS)
- 差异表达基因(Differentially Expressed Genes,DEGs)
- 单细胞RNA测序(Single-Cell RNA Sequencing,scRNA-seq)
- 批量RNA测序(Bulk RNA Sequencing)
- 低密度脂蛋白受体(LDL Receptor,LDLR)
- 载脂蛋白E(Apolipoprotein E,ApoE)
- 内皮细胞向间质细胞转化(Endothelial-to-Mesenchymal Transition,EndMT)
- 竞争性内源RNA(Competing Endogenous RNA,ceRNA)
- 脂质相关巨噬细胞(Lipid-Associated Macrophages,LAM)
- 逆向胆固醇运输(Reverse Cholesterol Transport,RCT)
- 基因本体论(Gene Ontology,GO)
- KEGG通路富集分析(Kyoto Encyclopedia of Genes and Genomes)
- 锌指核酸酶技术(Zinc Finger Nuclease)
- 膦脂酰肌醇3-激酶(PI3K)/蛋白激酶B(Akt)信号通路
- JAK-STAT信号通路
- 高密度脂蛋白(High-Density Lipoprotein,HDL)
- 超高分辨率显微镜(STORM)