基于
超声
射频
信号
支持
向量
参量
识别
方法
第 42 卷 第 5 期Vol.42,No.52023 年 9 月Journal of Applied AcousticsSeptember,2023 研究报告 基于超声射频信号的支持向量机双参量B线识别方法张皓宇马泉龙张 蕾钟 徽(西安交通大学生命学院生物医学信息工程教育部重点实验室西安710049)摘要:肺超声中的特殊征象B线对于临床诊断肺水肿等肺部疾病有重要意义,但诊断结果依赖于医生的主观判断。为了客观、自动地识别B线,提高诊断准确率,该文提出了一种基于超声回波射频信号的肺脏超声特殊征象B线识别方法。该文首先选取了射频信号的排列熵、信息熵、峰度、偏度、能量作为特征参数,利用独立样本t检验和单参数贝叶斯分类的方法检验超声射频数据中B线、非B线所对应射频数据的各个参量的差异性以及各参数与B线识别的相关性。然后将不同的双参量组合输入非线性支持向量机中进行分类,比较各个组合的分类效果。结果显示信息熵与排列熵参数组合基于射频信号的分类效果最好,分类灵敏度为90.521%,特异性为98.106%,准确率为96.328%,受试者工作特征曲线下面积等于0.95。在引入后处理算法后,B线识别效果有进一步提升,得到分类平均灵敏度为95.23%,平均特异性为97.22%,平均准确率为96.88%。研究结果表明基于射频数据的支持向量机双参量B线识别方法对辅助临床诊断具有重要价值,信息熵和排列熵的组合可以有效地对特殊征象B线进行高精度识别。关键词:肺超声;B线;射频信号;双参量;支持向量机中图法分类号:R318.6文献标识码:A文章编号:1000-310X(2023)05-0908-09DOI:10.11684/j.issn.1000-310X.2023.05.002Support vector machine-based two-parameter B-line identification method usingultrasound radio frequency signalZHANG HaoyuMA QuanlongZHANG LeiZHONG Hui(Key Laboratory of Biomedical Information Engineering of Ministry of Education Department of Biomedical Engineering,School of Life Science and Technology,Xian Jiaotong University,Xian 710049,China)Abstract:Special artifact B-line of lung ultrasound has important significance for clinical diagnosis of lunglesions like pulmonary edema and so on.However,accurate diagnosis depends on subjective judgment of thedoctor.In order to identify B line objectively and automatically,so as to improve the diagnostic accuracy,a B-line identification method for lung ultrasound using ultrasonic echo radio frequency(RF)signals wasproposed.The t-test and Bayes test methods were used to test distinction and identification correlation ofseveral characteristic parameters including permutation entropy,information entropy,kurtosis,skewness andenergy between B-Line and non-B-Line area.Different two-parameter combinations were input into nonlinearsupport vector machine(SVM)for classification.The classification results of these combinations were compared.2022-05-10收稿;2022-06-14定稿国家自然科学基金项目(31870983)作者简介:张皓宇(1998),男,湖北襄阳人,硕士研究生,研究方向:肺超声成像与应用。通信作者 E-mail:第42卷 第5期张皓宇等:基于超声射频信号的支持向量机双参量B线识别方法909The results showed that the two-parameter combination of information entropy and permutation entropyparameters had the best classification effect based on RF signals,with a sensitivity of 90.521%,specificityof 98.106%,accuracy of 96.328%and area under curve of 0.95.After the post-processing algorithm,theidentification effect of B-line was further improved,and the average sensitivity,specificity and accuracy ofclassification were 95.23%,97.22%and 96.88%respectively.The results showed that the SVM two-parameterB-line identification method based on RF data had important value in assisting clinical diagnosis,and thecombination of information entropy and permutation entropy could identify the B-line with high precision.Keywords:Lung ultrasound;B-line;Radio frequency signal;Two-parameter;Support vector machine0 引言随着现代超声医学的不断发展进步,曾经被视作超声盲区的肺脏超声检查也由于其无辐射、可床旁诊断等优点成为临床上检测肺脏疾病、监测重症病人生理指标的重要手段。肺超声中有一种被称为B线的重要超声伪影,多用于检测、诊断肺部疾病,在超声影像上表现为从胸膜线产生并延伸至屏幕底部的离散、激光样垂直高回声伪影1,并与肺滑动同步移动。1998年,Lichtenstein等2提出B线定义,并用肺脏超声图像中的B 线来区分肺水肿和慢性阻塞性肺病。2004年,Jambrik等3通过分析121名患者的胸部X光片与肺超声之间的相关性,证实了B线作为检测血管外肺水指标的可行性。2010年,Jambrik等4通过肺损伤动物模型实验验证了B线数量与肺干湿比之间的显著相关性,提出了一种简单、半定量、无创的评估肺超声B线的肺积水指数。肺超声影像中B 线数量的增加与肺水肿、肺纤维化、肺炎等肺病变之间显著的相关性已经成为临床上对患者进行床旁无创、快速诊断的重要依据,医生可以按照肺超声检查国际推荐标准5,快速评估患者的病情,并做出相应的诊断。但在相同的评估标准之下,不同的医生对同一患者的评估、甚至同一医生在不同时间对同一患者的评估都可能会产生一定偏差,这与评估者的临床经验、评估时的生理状态等因素有关。因此,能够辅助医生对肺超声进行评估的算法可以大大提高医生诊断的稳定性和准确性。2016年,Moshavegh等6提出了一种自动检测和表征B线的方法,该方法首先检测图像中分割胸膜线,再向下对B线进行检测。Corradi等7通过比较肺超声图像灰度值变化的平均值和标准差,提出了一种检测机械通气心脏手术患者肺水肿的计算机辅助定量方法。2020年,Cristiana等8提出了一种基于深度卷积神经网络的自动评估肺超声B线的深度学习算法,并将评估结果与超声专家评估结果进行比较,表现出较好的敏感性和特异性。现有的B线识别方法大多基于超声图像,但超声图像是由原始超声回波射频(Radio frequency,RF)信号经过预处理、平滑、对比度增强等处理得到的便于医生肉眼观察的图像,在由RF信号转变为图像的过程中,真实信号丢失或弱化了一部分的组织信息以换取超声图像更有利于观察的性能,故本文提出的利用原始RF信号对肺超声结果进行评估可以提高信息的利用率,避免不同超声仪器参数设置的影响,可以得到普适性更高的评估算法。与基于卷积神经网络的自动评估B线深度学习算法相比,本文采用的非线性支持向量机(Support vectormachine,SVM)复杂度更小,提取特征参量的运算量也更小,有望应用于临床超声检查中,实现实时的B线识别功能。1理论和方法1.1特征参数选取本文选用的超声RF数据每帧包含256条扫描线,每条扫描线有2336个数据点,采样率为40 MHz。由于B线的特征是垂直于成像探头的激光样线,与扫描线方向相同。故将每一条扫描线上的全部RF数据点看作一个识别对象,分别对每个识别对象提取信息熵、排列熵、峰度、偏度和能量5种特征参量,并评估这些参量B线识别的效果。(1)信息熵信息熵是反映信号混乱程度的参数9,信号越混乱,信息熵越大。肺中富含气体,超声波在气相表面发生全反射,无法探测气相后的组织信息,在超声图像上产生A线和黑色区域,黑色区域在RF信号中表现为0左右的低幅值数据,由于混响效应109102023 年 9 月而产生的B线在图像上表现为明亮的彗星尾征,在RF信号中表现为幅值较高的回波数据。本研究认为与正常肺气相区域相比,B线区域RF数据的信息熵在宏观上应具有更大的值,选取信息熵作为特征参量有助于B线识别算法的实现。信息熵的计算公式如下:H=ni=1f(Xi)log2f(Xi),(1)其中,H 为信息熵,X 为RF信号时间序列幅值,f(Xi)是信号幅值为 Xi的概率密度,单位为 bit。(2)排列熵排列熵是一种检测动力学突变和时间序列随机性的方法,可以反映出时间序列微小的细节变化,能够定量评估信号序列中含有的随机噪声,越规律的时间序列,排列熵越小11。本研究认为胸膜线下,病变导致的血管外肺水增多使得肺水肿区域富含气体与液体,而超声波在该区域的多次反射形成了B线,故B线区域与其他区域相比,其RF数据在微观上应具有一定的规律性与重复模式,选择排列熵作为特征参量有助于区分识别B线。排列熵的计算步骤如下:对一个含有2336个数据点的元素X 进行空间重构,得到矩阵Y 为Y=X(1)X(1+t)X(1+(m 1)t)X(2)X(2+t)X(2+(m 1)t)X(j)X(j+t)X(j+(m 1)t).X(K)X(K+t)X(K+(m 1)t),(2)式(2)中,m为嵌入维数,t为延迟时间,k=N (m 1)t,矩阵Y 的每一行都是一个重构分量,共有k个重构分量。(a)将每一个重构分量按照升序重新排列,得到向量中各元素位置的列索引构成一组符号序列:S(l)=j1,j2,jm,l=1,2,k,且 k 6 m!.(3)(b)M 维相空间映射不同的符号序列总共有m!种,计算每一种符号序列出现的次数除以总数m!,作为该符号序列出现的概率。得到概率P1,P2,PK,按公式(4)计算得到元素X 的排列熵:Hpe=kj=1Pjln(Pj),(4)式(4)中,Hpe为元素X 的排列熵,k为重构分量总数Pj为第j 个符号序列出现的概率。峰度与偏度是研究信号包络特征以及分级定征的常用统计量,本研究提取各个元素的峰度与偏度并进一步评估其在B线识别方面的效果。(3)峰度峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数。峰度反映了RF信号包络峰部的尖度,是和正态分布相比较而言的统计量,如果峰度大于3,峰的形状比较尖,比正态分布更陡峭,反之亦然。RF数据元素X 包络的峰度按公式(5)计算:Kurt(X)=E(X)4=E(X )4(E(X )2)2,(5)式(5)中,Kurt(X)为RF数据元素X 包络的峰度,为RF数据元素X 包络的均值。(4)偏度偏度是统计数据分布偏斜方向和程度的度量,反映了RF信号包络幅度值非对称性程度,偏度小于0 说明RF信号包络中出现了少量值较小的数据点,偏度大于0说明RF信号包络中出现了少量值较大的数据点。RF数据元素X包络的偏度按公式(6)计算:Skew(X)=E(X )3=k33=k3k3/22,(6)式(6)中,Skew(X)为RF数据元素X 包络的偏度,为 RF 数据元素X 包络的均值,为RF数据X 包络的方差,k2、k3分别表示二阶和三阶中心矩。(5)能量信号能量是表征信号时域特性的一个重要参数,从超声图像可以直观地看出与非B线区域相比,B线区域更加明亮,灰度值更高,RF数据同样表现出相似的特点,即B线区域幅值更大,信号能量更高,故本研究选择信号能量作为B线识别的特征参量,并进一步研究其B线识别性能。RF 信号元素X第42卷 第5期张皓宇等:基于超声射频信号的支持向量机双参量B线识别方法911的能量按公式(7)计算:E(X)=Nj=1|Xj|2,(7)式(7)中,E(X)为RF信号元素X 的能量,N 为元素X 中数据点的数量,Xj是元素 X 中第j 个数据点的幅值。1.2基于非线性SVM的分类识别SVM是一种监督学习方式的二分类模型,其决策边界是对学习样本求解的最大边距超平面,是一种具有稀疏性和稳健性的分类器,可以对线性可分的样本进行较准确的二元分类。对于线性不可分的学习样本,非线性SVM利用核函数,通过非线性映射算法将二位线性不可分的样本映射到高维特征空间中,使得样本点再高维空间线性可分,采用与线性SVM相同的间隔最大化原则学习得到非线性SVM模型。对于n维特征空间,目标超平面为wTx+b=0.(8)其中,w=(w1,w2,wn)为法向量;b为位移项。求解最大超平面:minw,b12w2s.t.yi(wT(xi)+b)1.(9)利用拉格朗日乘子法,结合特征空间多维特征,得到其对偶问题:maxmi=1i12mi=1mj=1ijyiyj(xi,xj),s.t.mi=1iyi=0,ai 0,(10)其中,(xi,xj)称为核函数,用于降低升维后特征空间的计算复杂度。本文主要使用的核函数为高斯核函数:(xi,xj)=expxi xj222.(11)本研究从肺超声RF数据提取的多个特征参数组成的二维原始空间均为线性不可分,故采用非线性SVM进行识别分类。2结果与分析2.1实验数据的获取本实验选用西安交通大学医学院实验动物中心提供的实验6只白兔,平均体质量2.3 kg。实验器材和药品包括兔台、兔子固定箱、5 mL注射器、留置针、0.9%氯化钠溶液、分析纯油酸、异氟烷。实验仪器采用Sonix Touch超声诊断系统,线阵超声探头,频率4 10 MHz。美国MATRX动物呼吸麻醉机,氧气流量400 mL/min,异氟烷麻醉挥发罐档位2 4。实验前对实验兔禁食8 H,并称重,将实验兔俯卧位放入兔子固定箱,佩戴呼吸麻醉机面罩,调整氧气流量至400 mL/min,麻醉挥发罐档位调至3档,待兔子麻醉后撤下兔子固定箱,仰卧位固定于兔台,胸部备皮。由左右两侧第四、第五肋间对肺进行超声检查,留取正常无B线、具有明显胸膜线和A线的肺部超声图(图1(a)和RF数据。按0.1 mL/kg经耳缘静脉注射分析纯油酸,制备急性肺损伤模型,每隔1 min进行一次肺超声检查,记录肺超声图像由存在少量B线(图1(b)到存在弥漫性B线(图1(c)过程的RF数据和对应的超声图像共100组。(a)?(A?)(b)?B?(c)?B?图1肺超声图Fig.1 Images of lung ultrasound9122023 年 9 月2.2单参数分析本文共选取100帧RF原始数据,依据B线从胸膜线产生并延伸至屏幕底部、与肺滑行同步运动、呈现离散、激光样垂直高回声的伪影表现的特征,对所有识别对象标定B线或非B线标签。分别统计B线区域与非B线区域各个特征参量的均值和标准差并使用独立样本t检验判断其是否有显著差异性,如表1所示。最后将各个参数随机平均分为10份,轮流取其中9份作为训练集,剩下1份作为测试集输入贝叶斯分类器,得到单参数分类的平均灵敏度、特异性、准确率和曲线下面积(Area undercurve,AUC)如表2所示。表1特征参数统计特征Table 1 Statistical characteristics of characteristic parameters特征参数B线非B线独立样本t检验均值标准差均值标准差P显著性信息熵8.5890.22538.1340.4430.05是排列熵1.9740.1192.4540.2870.05是峰度28.37315.78645.90822.3840.05是偏度5.067 1056.755 1042.392 1041.22 1030.05是能量6.1421084.351084.668 1084.087 1080.05是表2特征参数单参数贝叶斯分类Table 2Bayesian classification results ofsingle characteristic parameters特征参数灵敏度/%特异性/%准确率/%AUC信息熵72.54791.33785.0740.91排列熵89.95378.30382.1860.90峰度26.38496.20372.9300.72偏度3.28396.89565.6910.60能量8.22892.48464.3990.61由表1可见,对本文提取的5个特征参数分别进行独立样本t检验后,结果显示B线与非B线的上述所有特征参数之间均具有显著差异性(P 3条扫描线的宽度,同一条B线包含的扫描线在图像中的位置是连续的,并且B线从胸膜线产生,一直延续到屏幕底端。根据以上性质,本文在SVM识别的基础上提出了一种后处理的算法,可以有效地提高B线识别效果。对于SVM模型的识别结果,后处理算法首先遍历其识别为B线的扫描线位置,找到被识别为B线,但与其他B线间隔 5(每根扫描线的宽度为1)9142023 年 9 月且宽度6 2的扫描线区域,将其识别结果更正为非B线。再次遍历识别结果,找到所有间隔6 2的相邻B线,判断其间隔中非B线在屏幕底部位置是否依然具有较强的能量,若是,则认为此扫描线满足B线由胸膜线一直延伸到屏幕底端的性质,将其识别结果更正为B线,若否,则不做更改。图3展示了后处理算法提高B线识别效果的对比图。可以看出,后处理算法很好地找到B线区域中和非B线区域中识别错误的扫描线,并有效地更正了识别结果,得到了更加准确的B线位置与范围。表4展示了将排列熵加信息熵输入SVM后所有识别结果输入后处理算法得到的B线识别平均灵敏度、特异性和准确率。可以看出,后处理算法对B线识别的灵敏度有显著提升,达到95.23%,准确率也有提高(准确率96.88%),特异性有较小下降(特异性97.22%),综合3项指标可知后处理算法可以显著有效地提升B线识别能力,以较小的运算量改善SVM识别效果。表4后处理前后B线识别效果对比Table 4 Comparison of B-Line recognitioneffect before and after post-processing信息熵+排列熵灵敏度/%特异性/%准确率/%SVM识别效果90.52198.10696.328后处理后效果95.2397.2296.88(a)?B?B?(b)?B?B?图2SVM识别图(识别为B线的线束用蓝色在图中标注)Fig.2 SVM identification images(B-Line regions were marked in blue)(a)?B?(b)SVM?(c)?图3原始B超图像、SVM识别B线效果图和后处理效果图对比(图中蓝色标注的线束为识别为B线的线束)Fig.3 Comparison of original B mode images,SVM recognition images and post-processing images第42卷 第5期张皓宇等:基于超声射频信号的支持向量机双参量B线识别方法9153 讨论本研究基于超声RF数据进行肺超声特殊征象B线的识别,选取了RF数据的5种特征参数,包括信息熵、排列熵、包络峰度、偏度和RF信号能量。为了确定对于B线分类效果最好的特征参量以及最好的B线识别效果,对各个参数进行了独立样本t检验,采用单参数贝叶斯分类器与双参数非线性SVM,并选择了4种不同的特征参数组合输入SVM,对100帧RF数据进行了分类识别实验,进行了各特征参数的统计学分析,比较了各个参数单参数分类的效果、不同参数组合输入非线性SVM的识别效果以及单参数与双参数的识别效果,最后在信息熵与排列熵双参数SVM识别的基础上提出并采用了一种后处理算法,并对后处理算法的效果进行了比较分析。结果显示B线与非B线的所有特征参数之间均具有显著差异,但不同特征参数对于B线识别的相关性差别较大,根据单参数贝叶斯分类结果,标准差较小的排列熵和信息熵相关性较高,而标准差较大的峰度、偏度和信号能量相关度较低,说明对于两种类别RF信号的特征参数,具有显著差异性且标准差较小的特征参数更有利于B线的识别。与单参数贝叶斯分类相比,双参数SVM分类的识别灵敏度、特异性、准确率以及AUC均有显著的提高,且单参数分类效果好的特征参数作为双特征参数输入组合的一部分时,分类准确率也高于那些含有单参数分类效果较差的特征参数的参数组合,说明多参数输入分类器时会提供各自对于分类识别的能力,并且参数组合不仅仅包含单参数分类能力,还会由于参数间隐含的相关关系,使得参数组合与分类的相关度更高,进一步提高识别准确率。但本研究并未比较双参数组合与更高维度的特征参数组合输入SVM时的分类效果,后期研究会采用更高维度的特征参数组合,探究更高维特征空间对于B线识别的能力。4种输入非线性SVM的特征参数组合中,信息熵加排列熵的分类效果最好,平均灵敏度为90.521%,平均特异性为98.106%,平均准确率达到96.328%,AUC达到0.95,均大于其他3种输入特征参数的组合。进一步采用后处理算法对信息熵加排列熵的分类结果进行处理,显著改善B线识别效果,平均灵敏度达到95.23%,平均特异性为97.22%,平均准确率为96.88%,实现了对B线的较准确识别。本文提出的这种基于超声RF数据SVM双参数(信息熵和排列熵)B线识别方法相较于Cristiana等8提出的基于卷积神经网络的深度学习算法对计算机算力的要求更低,计算速度更快,有利于对B线的实时快速识别。Cristiana等8分析识别效果时计算的灵敏度、特异性等指标是以某超声图像是否存在B线为标准,比较模型识别与专家判断结果是否一致为依据,若模型识别与专家判断某超声图像中存在B线则认为识别正确,而本文是将超声图像的每条扫描线包含的所有RF数据作为一个最小的识别对象,分析识别效果时计算的灵敏度、特异性与准确率是以每一条扫描线是否属于B线为标准,比较模型识别与专家判断结果是否一致,识别结果不仅包含被识别的图像中是否存在B线的信息,并且指明了B线的具体位置与范围,可以为定量研究B线与肺病变严重程度的关系提供重要依据。本研究选用的超声RF数据来自油酸致肺损伤动物模型实验,实验中出现B线的具体病理可能并不统一,具有一定的局限性。在后续研究中会与相关医院超声科合作,获得可供研究的具体病例的RF数据,将B线识别与产生B线的具体病理特征结合起来,以提高B线识别的可靠性与特异性。4结论本文提出了一种基于超声RF信号的肺脏超声特殊征象B线的识别方法,提取肺超声RF数据的信息熵、排列熵、峰度、偏度和能量作为特征参数,利用单参数贝叶斯分类器以及非线性SVM,获得并比较了不同参数以及不同参数组合对于B线识别的效果,并将识别效果最好的信息熵加排列熵参数组合的识别结果输入后处理算法,最终得到B线识别平均灵敏度为95.23%,平均特异性为97.22%,平均准确率为96.88%,能够以较高的灵敏度、特异性和准确率实现对肺超声B线的识别。与基于图像的B线识别方法相比,本文提出的基于RF数据的B线识别方法受到超声仪器参数调整的影响更小,可以适用于多种不同超声仪器,普适性较强,应用场景较广。同时,基于RF数据提取的特征参量包含更多组9162023 年 9 月织结构信息,对B线的识别更加可靠有效,可以为临床经验有限的医生提供准确的辅助诊断信息,减缓肺超声诊断的学习曲线,提高诊断准确率。参考文献1 Volpicelli G,Elbarbary M,Blaivas M,et al.Interna-tional evidence-based recommendations for point-of-carelung ultrasoundJ.Intensive Care Medicine,2012,38(4):577591.2 Lichtenstein D,Mezire G.A lung ultrasound sign al-lowing bedside distinction between pulmonary edemaand COPD:the comet-tail artifactJ.Intensive CareMedicine,1998,24(12):13311334.3 Jambrik Z,Monti S,Coppola V,et al.Usefulness of ultra-sound lung comets as a nonradiologic sign of extravascu-lar lung waterJ.American Journal of Cardiology,2004,93(10):12651270.4 Jambrik Z,Gargani L,Adamicza A,et al.B-lines quan-tify the lung water content:a lung ultrasound versus lunggravimetry study in acute lung injuryJ.Ultrasound inMedicine&Biology,2010,36(12):20042010.5 Volpicelli G,Elbarbary M,Blaivas M,et al.Interna-tional evidence-based recommendations for point-of-carelung ultrasoundJ.Intensive Care Medicine,2012,38(4):577591.6 Moshavegh R,Hansen K L,Srensen H M,et al.Novelautomatic detection of pleura and B-lines(comet-tail arti-facts)on in vivo lung ultrasound scansC/Spie MedicalImaging,2016.7 Corradi F,Brusasco C,Vezzani A,et al.Computer-aided quantitative ultrasonography for detection of pul-monary edema in mechanically ventilated cardiac surgerypatientsJ.Chest,2016,150(3):640651.8 Cristiana B,Grzegorz T,Seungsoo K,et al.Automatedlung ultrasound B-line assessment using a deep learn-ing algorithmJ.IEEE Transactions on Ultrasonics Ferro-electrics and Frequency Control,2020,67(11):23122320.9 Shannon C E.A mathematical theory of communica-tionJ.Bell Systems Technical Journal,1948,27(4):623656.10 Soldati G,Demi M,Smargiassi A,et al.The role of ul-trasound lung artifacts in the diagnosis of respiratory dis-easesJ.Expert Review of Respiratory Medicine,2019,13(2):163172.11 Bandt C,Pompe B.Permutation entropy:a natural com-plexity measure for time seriesJ.Physical Review Let-ters,2002,88(17):174102.