第29章颈动脉超声中有症状与无症状斑块的分类

第一节章节概述

本章由U. Rajendra Acharya、Oliver Faust、S. Vinitha Sree、Filippo Molinari、Luca Saba、Andrew Nicolaides和Jasjit S. Suri等人撰写，发表于Springer出版的《Multi-Modality Atherosclerosis Imaging and Diagnosis》一书第29章，全章共914行文本，约37KB。本章提出了一个基于离散小波变换（Discrete Wavelet Transform, DWT）特征和支撑向量机（Support Vector Machine, SVM）分类器的计算机辅助诊断（Computer-Aided Diagnosis, CAD）系统，用于在B型超声图像中自动区分有症状与无症状颈动脉斑块。

该系统名为Atheromatic™系统（Global Biomedical Technologies, Inc., California, USA），其核心流程包括：离线和在线两套子系统，离线系统利用346幅颈动脉斑块超声图像（150幅无症状、196幅有症状）提取灰度特征，通过t检验筛选显著性特征，训练SVM分类器并确定训练参数；在线系统则利用离线训练得到的参数对新的患者图像进行实时预测分类。研究使用了54种不同小波函数和15种分类器进行系统评估，最终确定双正交3.1（bior3.1）小波结合二阶多项式核SVM为最优配置，实现了83.7%的分类准确率、80%的灵敏度和86.4%的特异度。

本章属于全书方法应用类章节，系统性地将信号处理与机器学习技术引入颈动脉粥样硬化的临床诊断领域，填补了超声图像主观性判读的技术空白，为血管外科医生在选择患者进行颈动脉内膜切除术（CEA）或颈动脉支架置入术（CAS）时提供了客观的辅助决策依据。

第二节关键问题与研究动机

颈动脉狭窄（Carotid Stenosis）是动脉粥样硬化的重要表现，也是脑卒中发生的重要预测因子。世界卫生组织（WHO）估计，到2030年全球将有约2360万人死于心脑血管疾病，其中脑卒中占据相当比例。颈动脉粥样硬化斑块的破裂会导致危及生命的栓塞事件，研究表明74%的有症状斑块发生了破裂，而无症状斑块中仅有32%发生破裂。因此，准确区分有症状与无症状斑块对于治疗决策至关重要。

临床上，颈动脉狭窄的治疗方式主要包括颈动脉内膜切除术（CEA）和颈动脉支架置入术（CAS），但两种手术均存在一定风险。CREST研究显示，CAS术后脑卒中风险较高，而CEA术后心肌梗死风险较高。由于并非所有有症状患者都需要接受手术干预，准确筛选出高风险患者成为临床决策的核心挑战。

传统超声成像虽然成本低廉、操作简便，但超声图像特征与组织学评估之间的相关性往往较差，主要限制因素包括空间分辨率低和超声伪影。既往研究，如Kyriacou等人使用10个纹理和形态学特征结合神经和统计分类器仅获得约71.2%的准确率；其他基于纹理特征、运动特征或形态学分析的方法准确率也多在66.8%至84%之间。这些方法普遍存在准确率不足或特征维度较高的问题。

本章研究的核心动机在于：开发一种低成本、非侵入性的CAD系统，利用先进的图像处理和数据挖掘技术，从超声图像中自动提取显著性特征，实现有症状与无症状斑块的精准分类，从而辅助医生做出更准确的治疗决策，降低患者不必要的手术风险和医疗负担。

第三节主要公式与推导

本章涉及的核心公式主要集中于离散小波变换（DWT）特征提取和支撑向量机（SVM）分类器两个部分。以下按类别详细阐述。

3.1 离散小波变换（DWT）

DWT通过将信号通过一系列下采样高通和低通滤波器来分解信号。对于一维信号x[n]，高通滤波器的输出（细节系数）为：

\[D[n] = \sum_{k=-\infty}^{+\infty} x[k] \cdot h[2n - k] \qquad(29.1)\]

低通滤波器的输出（近似系数）为：

\[A[n] = \sum_{k=-\infty}^{+\infty} x[k] \cdot g[2n - k] \qquad(29.2)\]

其中$h[n]$为高通滤波器的冲激响应，$g[n]$为低通滤波器的冲激响应。每经过一级分解，样本数减半，频率分辨率加倍。

在二维图像信号处理中（图像表示为$m \times n$的灰度矩阵$I[i,j]$），2D DWT产生四个结果矩阵：水平细节系数$Dh1$、垂直细节系数$Dv1$、对角细节系数$Dd1$和近似系数$A1$。为将高维矩阵压缩为单一数值用于分类，定义了三种平均特征：

水平方向平均特征：

\[\text{AverageDh1}(Ah) = \frac{1}{N \times M} \sum_{x=0}^{N-1} \sum_{y=0}^{M-1} |Dh1(x,y)| \qquad(29.3)\]

垂直方向平均特征：

\[\text{AverageDv1}(Av) = \frac{1}{N \times M} \sum_{x=0}^{N-1} \sum_{y=0}^{M-1} |Dv1(x,y)| \qquad(29.4)\]

能量特征：

\[E = \frac{1}{N^2 \times M^2} \sum_{x=0}^{N-1} \sum_{y=0}^{M-1} (Dv1(x,y))^2 \qquad(29.5)\]

这三个特征构成最终的特征向量。

3.2 t检验特征选择

t检验用于验证特征是否能够有效区分两类斑块。零假设为两类特征均值相等。t统计量为两类特征均值之差与类间标准误差的比值。p值用于判断差异的显著性：p值越低（<0.01或<0.05），说明该特征在两类之间的差异越显著，越适合作为分类输入特征。

3.3 支撑向量机（SVM）分类器

SVM是一种基于超平面的非参数分类器。对于线性模型：

\[y(x) = w^T \phi(x) + b \qquad(29.6)\]

其中$\phi(\cdot)$为特征变换核函数，$b$为偏置参数，$w$为超平面的法向量。

SVM的训练过程转化为以下约束优化问题：

\[\min_{w,b,\xi} \frac{1}{2} \|w\|^2 + C \sum_{i=1}^{N} \xi_i \qquad(29.7)\]

约束条件为：

\[c_i y(x_i) \geq 1 - \xi_i, \quad \xi_i \geq 0 \qquad(29.7)\]

其中$\xi_i$为误分类样本的惩罚项，$C$为正则化参数，控制误分类样本与间隔大小之间的权衡。

对应的拉格朗日函数为：

\[L(w,b,a) = \frac{1}{2} \|w\|^2 + C \sum_{i=1}^{N} \xi_i - \sum_{i=1}^{N} a_i [c_i y(x_i) - 1 + \xi_i] - \sum_{i=1}^{N} \lambda_i \xi_i \qquad(29.8)\]

经消除$w$、$b$和$\xi_i$后，得到需要最大化的对偶拉格朗日函数：

\[Q_L(a) = \sum_{i=1}^{N} a_i - \frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} a_i a_j c_i c_j k(x_i, x_j) \qquad(29.9)\]

其中核函数$k(x_i,x_j) = \phi(x_i)^T \phi(x_j)$，约束条件为$0 \leq a_i \leq C$和$\sum_{i=1}^{N} a_i c_i = 0$。

预测模型为：

\[y(x) = \sum_{i=1}^{N} a_i c_i k(x, x_i) + b \qquad(29.10)\]

偏置$b$的估计为：

\[b = \frac{1}{|M|} \sum_{i \in M} \left[ c_i - \sum_{j \in S} a_j c_j k(x_i, x_j) \right] \qquad(29.11)\]

其中$M$为满足$0 < a_i < C$的指标集合，$S$为支持向量集合。

3.4 核函数

多项式核函数：

\[k(x_i, x_j) = (1 + x_i \cdot x_j)^p \qquad(29.12)\]

其中$p$为多项式的阶数。

径向基函数（RBF）核：

\[k(x_i, x_j) = \exp\left(-\frac{\|x_i - x_j\|^2}{2\sigma^2}\right) \qquad(29.13)\]

3.5 性能评估指标

灵敏度（敏感性）：

\[\text{Sensitivity} = \frac{TP}{TP + FN} \qquad(29.14)\]

特异度：

\[\text{Specificity} = \frac{TN}{TN + FP} \qquad(29.15)\]

阳性预测值（PPV）：

\[PPV = \frac{TP}{TP + FP} \qquad(29.16)\]

准确率：

\[\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} \qquad(29.17)\]

第四节关键算法与建模方法

4.1 系统架构

整个CAD系统分为离线和在线两部分。离线系统利用已知类别标签的训练图像集提取DWT特征，通过t检验筛选显著性特征，训练SVM分类器并生成训练参数。在线系统则接收新的患者超声图像，提取相同特征，利用离线训练的参数通过SVM决策函数预测斑块类别。

4.2 数据采集与预处理

本研究使用了346幅颈动脉斑块超声图像（150幅无症状、196幅有症状），采集自塞浦路斯尼科西亚血管筛查诊断中心。纳入标准包括：斑块狭窄程度≥50%，排除心源性栓塞症状或远期症状（>6个月）的患者。图像采集过程中实施了严格的归一化程序，包括动态范围适配、帧平均、时间增益补偿曲线校准和增益调整等，以确保图像质量的一致性。灰度归一化以血液（中值灰度0–5）和外膜（中值灰度180–190）为参考点手动进行。

有症状斑块组包括88例脑卒中、70例短暂性脑缺血发作（TIA）和38例一过性黑矇（AF）患者。感兴趣区域（ROI）由经验丰富的血管外科医生和超声医师手动描绘，ROI通常占整个图像不到25%，聚焦于颈动脉病变最关键的区域。

4.3 小波函数选择

研究评估了多种小波函数族，包括Reverse Biorthogonal（rbio）、Daubechies（db）、Biorthogonal（bior）、Coi flets、Symlets、Discrete Meyer（dmey）和Haar家族。在54种不同小波函数的对比中，双正交3.1（bior3.1）小波表现最优，被选为最终的特征提取工具。

4.4 三折分层交叉验证

采用三层分层交叉验证协议评估分类器性能：将346幅图像分为三等份，每份保持与整体相同的两类比例。每次以两份（242幅图像）训练、一份（104幅图像）测试，循环三次，最终取各次性能指标的平均值作为最终结果。训练集包含137幅有症状图像（26幅AF、49幅TIA、62幅脑卒中）和105幅无症状图像；测试集包含59幅有症状图像（12幅AF、21幅TIA、26幅脑卒中）和45幅无症状图像。

4.5 分类器配置

研究对比了15种分类器，其中SVM表现最佳。SVM分类器分别采用线性核、一阶至三阶多项式核以及RBF核进行配置。最终确定二阶多项式核SVM为最优分类器：准确率83.7%、灵敏度80%、特异度86.4%、PPV 81.8%。

第五节主要结论

本章研究得出以下核心结论：

第一，基于DWT的灰度特征能够有效区分有症状与无症状颈动脉斑块。三种显著性特征——水平细节系数均值（Average Dh1）、垂直细节系数均值（Average Dv1）和能量（Energy）——在两类斑块之间存在统计学显著差异（p值均<0.0001）。具体而言，无症状斑块的Average Dh1均值为0.14±0.03，有症状斑块为0.10±0.04；无症状斑块的Average Dv1均值为5.49E-02±1.47E-02，有症状斑块为3.82E-02±1.55E-02；无症状斑块的能量均值为7.17E-08±1.99E-08，有症状斑块为5.47E-08±2.22E-08。

第二，二阶多项式核SVM分类器在本数据集上实现了最优性能。与其他核函数相比，二阶多项式核在灵敏度与特异度之间取得了最佳平衡，准确率达83.7%，显著高于既往文献报道的大多数方法（如Kyriacou等人的71.2%、Acharya等人早前研究的82.4%等）。

第三，该系统的核心优势在于使用极少量特征（仅三个）即可达到较高准确率，同时具备实时性、低成本、可扩展性等优点。该框架已成功扩展至甲状腺和肝脏超声分析领域，显示出良好的通用性。

第四，尽管83.7%的准确率已是同类研究中的较高水平，但仍有提升空间。研究中指出横断面研究的固有局限性：部分当时标记为无症状的斑块实际上可能已处于高风险状态，未来若发生破裂将导致准确率被低估。

第六节挑战与开放问题

尽管本章提出的方法取得了较好的分类性能，但仍存在以下挑战和待解决的问题：

首先，准确率提升遇到瓶颈。研究表明，当前的83.7%准确率难以在短期内大幅提高，主要原因在于横断面研究的固有设计缺陷——部分无症状斑块从纹理特征上看属于高风险斑块，但因尚未发生临床事件而被错误标记为阴性，只有通过前瞻性纵向研究才能从根本上解决这一标签偏差问题。

其次，感兴趣区域（ROI）的分割仍依赖人工手动描绘，这不仅增加了系统对专业人员的依赖，也引入了操作者间变异。未来应开发自动或半自动ROI分割算法以减少人为因素影响，提高系统的可重复性和临床适用性。

第三，地面真值（ground truth）的判定存在不确定性。部分患者的症状可能并非由颈动脉斑块本身引起（如心源性栓子），而是其他来源；此外，部分患者可能遗忘既往症状史而被误分类。未来的研究可考虑通过病理学研究直接确定斑块性质，而非仅依赖临床症状报告。

第四，本研究仅利用了超声图像的灰度信息，未充分挖掘其他模态（如CTA、MRA、血管造影等）的互补信息。多模态融合可能为进一步提高分类准确性提供新的突破口。

第五，研究中未详细探讨不同小波函数导致性能差异的深层次原因，对于为何bior3.1小波在本任务中表现最优缺乏理论解释。

第七节个人思考与批判性分析

7.1 方法学评价

本研究将DWT特征提取与SVM分类器相结合的技术路线在工程上较为成熟，但也存在一定的方法学局限。从信号处理角度，DWT能够有效捕捉超声图像的多尺度纹理信息，这是其优势所在；但仅使用Level 1分解可能无法充分挖掘更深层次的结构特征，是否应探索更多分解层级值得思考。从机器学习角度，SVM作为一种间隔最大化分类器，在小样本高维特征场景下表现稳定，但研究中特征维度极低（仅三维），可能未能充分发挥SVM在高维空间的优势。

7.2 临床转化价值

本研究的临床意义在于为血管外科医生提供了一种客观、定量的斑块风险评估工具。然而，83.7%的准确率对于常规临床工作流程而言可能仍不够可靠——尤其是在涉及手术决策时，假阳性可能导致不必要的手术风险，假阴性则可能使高风险患者错过最佳干预时机。因此，该系统目前更适于作为第二意见工具而非独立诊断系统。

7.3 与同类研究的比较

与文献中其他方法相比，本研究的核心贡献在于以极低特征维度（三维）实现了相对较高的分类准确率。既往研究中Kyriacou等人使用10个特征仅获得71.2%的准确率，Stoitsis等人结合纹理和运动特征虽达到84%的准确率但特征维度更高。本研究证明了"少而精"的特征选择策略在医学图像分类中的可行性。

7.4 未来研究方向

若条件允许，以下方向值得深入探索：（1）引入更多分解层级的高频和低频特征，探索深度学习（特别是卷积神经网络）在端到端特征学习中的潜力；（2）结合多模态成像数据进行特征融合，从不同物理角度捕捉斑块特征；（3）开展前瞻性纵向研究，建立斑块演化与临床事件之间的时序关系；（4）开发基于深度学习的自动ROI分割算法，降低系统对专业操作人员的依赖。

7.5 对个人研究的启发

本章的研究范式——从临床问题出发、系统性地评估从特征提取到分类器选择的全流程——为类似医学图像分析研究提供了良好的方法论模板。尤其是作者采用54种小波函数和15种分类器进行系统对比的思路，体现了工程研究中"穷举式"方法论的价值。本人认为，在类似研究中应更加注重特征的可解释性——即所提取的特征是否与斑块的病理学本质（如脂质核心大小、纤维帽厚度、炎症程度等）存在物理关联，而非单纯追求统计指标的最优化。

公式汇总

编号	名称	形式	物理意义	类型
(29.1)	DWT高通滤波输出（细节系数）	$D[n] = \sum_{k} x[k] \cdot h[2n-k]$	信号经高通滤波后的细节分量，反映高频成分	(T)
(29.2)	DWT低通滤波输出（近似系数）	$A[n] = \sum_{k} x[k] \cdot g[2n-k]$	信号经低通滤波后的近似分量，反映低频成分	(T)
(29.3)	水平方向DWT均值特征	$\text{AverageDh1} = \frac{1}{N \times M} \sum_{x,y}	Dh1(x,y)	$
(29.4)	垂直方向DWT均值特征	$\text{AverageDv1} = \frac{1}{N \times M} \sum_{x,y}	Dv1(x,y)	$
(29.5)	DWT能量特征	$E = \frac{1}{N^2 \times M^2} \sum_{x,y} (Dv1(x,y))^2$	垂直细节系数的能量，反映图像的总体纹理能量	(T)
(29.6)	SVM线性模型	$y(x) = w^T \phi(x) + b$	超平面分类决策函数，将特征映射至高维空间分类	(T)
(29.7)	SVM约束优化目标	$\min_{w,b,\xi} \frac{1}{2}\\|w\\|^2 + C\sum\xi_i$	最大化间隔同时惩罚误分类样本	(T)
(29.8)	SVM拉格朗日函数	$L(w,b,a) = \frac{1}{2}\\|w\\|^2 + C\sum\xi_i - \sum a_i[c_i y(x_i)-1+\xi_i] - \sum\lambda_i\xi_i$	引入拉格朗日乘子求解优化问题	(T)
(29.9)	对偶拉格朗日函数	$Q_L(a) = \sum a_i - \frac{1}{2}\sum\sum a_i a_j c_i c_j k(x_i,x_j)$	SVM对偶优化问题的目标函数	(T)
(29.10)	SVM预测模型	$y(x) = \sum_i a_i c_i k(x,x_i) + b$	基于支持向量的最终分类决策函数	(T)
(29.11)	SVM偏置估计	$b = \frac{1}{	M	}\sum_{i\in M}\left[c_i - \sum_{j\in S} a_j c_j k(x_i,x_j)\right]$
(29.12)	多项式核函数	$k(x_i,x_j) = (1 + x_i \cdot x_j)^p$	将特征映射至$p$阶多项式空间，实现非线性分类	(T)
(29.13)	RBF核函数	$k(x_i,x_j) = \exp\left(-\frac{\\|x_i-x_j\\|^2}{2\sigma^2}\right)$	高斯径向基核，将特征映射至无穷维空间	(T)
(29.14)	灵敏度	$\text{Sensitivity} = \frac{TP}{TP+FN}$	正确识别有症状斑块的能力	(E)
(29.15)	特异度	$\text{Specificity} = \frac{TN}{TN+FP}$	正确识别无症状斑块的能力	(E)
(29.16)	阳性预测值	$PPV = \frac{TP}{TP+FP}$	预测为有症状者中真正有症状的比例	(E)
(29.17)	准确率	$\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}$	总体分类正确的比例	(E)

注：（T）= 理论推导公式；（E）= 经验定义公式。

编号	名称	形式	物理意义	类型
(29.1)	DWT高通滤波输出（细节系数）	\(D[n] = \sum_{k} x[k] \cdot h[2n-k]\)	信号经高通滤波后的细节分量，反映高频成分	(T)
(29.2)	DWT低通滤波输出（近似系数）	\(A[n] = \sum_{k} x[k] \cdot g[2n-k]\)	信号经低通滤波后的近似分量，反映低频成分	(T)
(29.3)	水平方向DWT均值特征	$\text{AverageDh1} = \frac{1}{N \times M} \sum_{x,y}	Dh1(x,y)	$
(29.4)	垂直方向DWT均值特征	$\text{AverageDv1} = \frac{1}{N \times M} \sum_{x,y}	Dv1(x,y)	$
(29.5)	DWT能量特征	\(E = \frac{1}{N^2 \times M^2} \sum_{x,y} (Dv1(x,y))^2\)	垂直细节系数的能量，反映图像的总体纹理能量	(T)
(29.6)	SVM线性模型	\(y(x) = w^T \phi(x) + b\)	超平面分类决策函数，将特征映射至高维空间分类	(T)
(29.7)	SVM约束优化目标	\(\min_{w,b,\xi} \frac{1}{2}\\|w\\|^2 + C\sum\xi_i\)	最大化间隔同时惩罚误分类样本	(T)
(29.8)	SVM拉格朗日函数	\(L(w,b,a) = \frac{1}{2}\\|w\\|^2 + C\sum\xi_i - \sum a_i[c_i y(x_i)-1+\xi_i] - \sum\lambda_i\xi_i\)	引入拉格朗日乘子求解优化问题	(T)
(29.9)	对偶拉格朗日函数	\(Q_L(a) = \sum a_i - \frac{1}{2}\sum\sum a_i a_j c_i c_j k(x_i,x_j)\)	SVM对偶优化问题的目标函数	(T)
(29.10)	SVM预测模型	\(y(x) = \sum_i a_i c_i k(x,x_i) + b\)	基于支持向量的最终分类决策函数	(T)
(29.11)	SVM偏置估计	$b = \frac{1}{	M	}\sum_{i\in M}\left[c_i - \sum_{j\in S} a_j c_j k(x_i,x_j)\right]$
(29.12)	多项式核函数	\(k(x_i,x_j) = (1 + x_i \cdot x_j)^p\)	将特征映射至\(p\)阶多项式空间，实现非线性分类	(T)
(29.13)	RBF核函数	\(k(x_i,x_j) = \exp\left(-\frac{\\|x_i-x_j\\|^2}{2\sigma^2}\right)\)	高斯径向基核，将特征映射至无穷维空间	(T)
(29.14)	灵敏度	\(\text{Sensitivity} = \frac{TP}{TP+FN}\)	正确识别有症状斑块的能力	(E)
(29.15)	特异度	\(\text{Specificity} = \frac{TN}{TN+FP}\)	正确识别无症状斑块的能力	(E)
(29.16)	阳性预测值	\(PPV = \frac{TP}{TP+FP}\)	预测为有症状者中真正有症状的比例	(E)
(29.17)	准确率	\(\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}\)	总体分类正确的比例	(E)

第29章 颈动脉超声中有症状与无症状斑块的分类

第一节 章节概述

第二节 关键问题与研究动机

第三节 主要公式与推导