• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于三阶统计量的欠定盲源分离方法

    时间:2023-01-26 10:35:03 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    邹 亮 张 鹏 陈 勋

    ①(中国矿业大学信息与控制工程学院 徐州 221116)

    ②(中国科学技术大学信息科学技术学院 合肥 230026)

    盲源分离(Blind Source Separation, BSS)凭借着其强大的技术优势,在生物医学信号处理、移动通信、地质勘探、语音信号处理和故障检测等领域得到了广泛的运用[1–5]。它旨在将无法直接观测到的源信号从被干扰和噪声污染的混合信号中分离出来。所谓的“盲”有两重含义:原始的源信号不能被直接观测到;
    源信号如何混合也是未知的。以语音信号为例,当多个声源同时存在时,如果忽略麦克风自身的非线性特性和信号的反射,麦克风的输入信号为各个声源的线性混合。以盲源分离为基础的信号处理技术在大量实验和应用中被证实可以有效分离出源信号,便于对信号的进一步分析。

    根据源信号和观测信号数目的相对多少,盲源分离分为超定、正定、欠定3种情况。超定和正定情况下,独立成分分析(Independent Component Analysis, ICA)是最经典的盲源分离算法之一[6]。其中,FastICA采用拟牛顿法实现参数寻优,收敛速度较梯度下降算法明显加快[7]。受信号采集条件和成本的限制,人们尝试使用较少的传感器实现对信号的检测,欠定盲源分离(Underdetermined Blind Source Separation, UBSS)应运而生。大部分欠定盲源分离算法从信号的稀疏性出发,在时域或变换域(如短时傅里叶变换、小波变换等)中寻找单数据源点估计混合矩阵进而实现源信号的恢复[8–10]。较为经典的算法包括基于时频域比率的TIFROM(TIme Frequency Ratio Of Mixtures)和退化分离估计技术DUET(Degenerate Unmixing Estimation Technique)[11,12]。在这两种算法的基础上,衍生出了诸多欠定盲源分离算法,进一步放松了对源信号稀疏性的要求。文献[13]基于对观测信号傅里叶变换的实、虚部系数的比较,提出了一种新颖的单信号源点(Single Source Points, SSP)检测方法,通过聚类分析估计混合矩阵。文献[14]通过检测在时频域中对应点在复平面上是否共线实现SSP的筛选。文献[15]通过对观测信号的稀疏编码,用L1正则化约束条件,提高了算法的鲁棒性。文献[16]利用特定源信号对应的单信号源点距离较小的特点,筛选出各个源信号对应的单信号源点,进而利用K-means实现混合矩阵的估计。然而,基于信号的稀疏性的欠定盲源分离算法往往对噪声比较敏感。许多研究人员尝试利用观测信号的统计特性解决欠定盲源分离问题。文献[17–19]通过对源信号的2阶统计特性进行分析,利用张量的典范双峰分解(canonical polyadic decomposition)和塔克分解(Tucker decomposition),开发了一系列的欠定盲源分离算法。其中文献[18]提出从多数据集角度解决欠定盲源分离问题,利用多数据集源信号的2阶相关性构建3阶张量,进而实现混合矩阵估计。然而,高斯噪声等对称分布噪声的2阶累积量不为零,影响了混合矩阵估计的准确率。

    高斯信号所有关于分布的信息都包含在1阶与2阶矩以内,2阶以上的累积量恒等于0。为了更好地抑制对称分布噪声的影响,本文提出基于3阶累积量和源信号自相关特性的欠定盲源分离方法,并将所提出的算法与经典欠定盲源分离算法进行比较。在语音信号上的1000次蒙特卡罗实验发现,本文提出的算法能够更好地抑制噪声对混合矩阵估计的影响。对本文感兴趣的读者可参考相关源代码https://github.com/usefulbbs/thirdOrder。

    瞬时混合的盲源分离模型为

    其中,X(t)=[x1(t),x2(t),...,xM(t)]T表 示M个传感器接收的观测信号,S(t)=[s1(t),s2(t),...,sN(t)]T表示N个潜在的源信号,A为M×N维的混合矩阵,E(t)表示信号采集过程中的噪声。通常假设噪声是均值为0且与源信号不相关的高斯信号。当M N时,式(1)表示欠定情形下的信号线性混合模型,其实质是利用较少的观测信号实现混合矩阵的估计和源信号的恢复。

    在解决欠定盲源分离问题时,通常需要对问题的模型设定一定的假设条件,如信号的时频域稀疏性、源信号的统计独立性等,然后采用先估计混合矩阵后分离源信号的“两步法”实现盲源分离。鉴于源信号稀疏性假设在现实情形中较难满足,本文提出了利用混合信号3阶统计量的研究思路,基于以下3个假设:

    假设(1):当i̸=j时 ,si(t)和sj(t)不相关;

    假设(2):源信号为均值为零的非高斯信号;

    假设(3):混合矩阵A列向量中任意两个列向量不共线。

    近年来,世界主要国家及地区开始逐渐禁止塑料微珠在冲洗类化妆品等日化产品中的使用。究其原因,塑料微珠作为新型生态污染源对生态环境的影响及危害受到了业界的高度重视,也引起了热议。为此,笔者收集并整理了塑料微珠的定义及其危害,以及近年来相关国家及地区对塑料微珠的一系列监管动态,帮助企业了解及应对塑料微珠禁令;
    同时,也希望中国化妆品监管机构积极应对并做出调整,顺应塑料微珠禁用全球化的趋势。

    对均值为零的观测信号,其3阶统计量可以表示为

    其中,观测信号的3阶统计量中任何一个元素π(i,j,k)可以表示为

    其中,⊙为哈达玛积,Ai,:,Aj,:,Ak,:表示混合矩阵A的 第i,j,k行向量,其中i,j,k=1,2,...,M,3阶张量π的尺寸为M×M×M。τ1,τ2分别表示对观测信号的延时,×n表示张量的n-模乘积。为了简便计算,文中令τ1=τ2。D=cum[S(t),S(t+τ),S(t+τ)]为源信号的3阶累积量,其尺寸为N×N×N。由假设(1)和假设(2)可知D为超对角张量

    通过改变延时τ的大小,构建了Q个不同的3阶张量,对应着各个延时,具体可以表示为

    其 中,τq为 观 测 信 号 延 时 大 小,张 量D(τq)=cum(S(t),S(t+τq),S(t+τq))为超对角张量,其中q=1,2,...,Q。

    本文将张量π(1),π(2),...,π(Q)堆叠在一起,组成一个4阶张量W∈RM×M×M×Q,其公式满足Wi,j,k,q=(π(q))i,j,k,i=1,2,...,M,j=1,2,...,M,k=1,2,...,M,q=1,2,...,Q。定义矩阵H∈RQ×N,其中的元素为Hq,n=,其中q=1,2,...,Q,n=1,2,...,N,A:,n表 示 为 混 合 矩 阵 的 第n列 列 向量,H:,n为 矩阵H的第n列 列向量。4阶张量W可以表示为

    从而混合矩阵的估计问题,可以转化为求解一个凸优化问题,目标函数为

    对于超定或正定盲源分离问题,可以通过求混合矩阵的逆矩阵恢复源信号。然而,当观测信号数目少于信号源数目时,混合矩阵是病态矩阵,不能通过直接求逆来恢复源信号。受文献[14]启发,本文采用广义高斯模型对信号进行恢复。

    对于任何欠定的非齐次线性方程,其解可以表示为通解与特解的和。对于本文的欠定盲源分离问题,方程AS=X的 解S可以表示为

    其中,Sp表 示方程的特解,Sh表示方程的通解。特解Sp可以表示为

    这里矩阵(A)†表 示矩阵A的伪逆。齐次方程的通解可以写成

    其中,V是一个大小为N×(N −M)矩阵,该矩阵的列向量为矩阵A零空间的基。矩阵Z则是大小为(N −M)×T的任意矩阵(T表示每个观测信号样本点的个数)。基矩阵V可以根据混合矩阵A计算得到,因此估计N维的源信号的问题转化为计算N −M维潜在变量Z。本文采用广义高斯模型来对源信号的概率密度函数进行建模,广义高斯模型可以表示为

    其中,Γ(·) 为 伽马函数,u和σ分别为单个信号的均值和方差。通常人们关注的主要是源信号的变化而非信号的幅度,此处假设各个源信号的均值u为0。β为源信号峰态的控制参数,σ为源信号的方差。本文采用期望最大算法(Expectation Maximization,EM)估计模型的隐变量。本文重点关注欠定情形下混合矩阵的估计,源信号恢复的具体细节请参考文献[14]。

    基于3阶统计量的欠定盲源分离算法的主要步骤如表1所示。本文默认选择最小延时为0.0625 ms,延时间隔为0.125 ms,延时数目Q为10。

    表1 本文算法步骤

    5.1 性能评价指标

    本文采用归一化均方误差(Normalized Mean Square Error, NMSE)和平均绝对皮尔逊相关系数(Mean Absolute Pearson Correlation Coefficient,MAPCC)来衡量混合矩阵的估计精度和源信号的估计精度[13,18],其数学表达式分别如式(15)

    其中,sn表示第n个通道源信号的真实值,sˆn表示恢复出的sn,σ表示信号的标准差,c ov()表示信号之间的协方差。源信号真实值与恢复结果之间的相关系数越高表示信号恢复越准确。MAPCC为源信号真实值之间PCC绝对值的平均数,可以表示为

    其中,MAPCC的取值范围为[0,1]。由于噪声等因素的影响,很难完全恢复源信号。通常认为,MAPCC大于0.8时表明信号恢复的性能较好。文中所有实验的计算环境配置如下:处理器Intel(R)Core(TM) i5-10200H CPU @2.40 GHz, 16 GB内存,计算软件MATLAB 2019b。

    5.2 仿真实验

    本文选择4通道语音信号作为源信号(如图1),采样频率为16000 Hz,采样点长度为160000。

    图1 4个语音源信号

    经过3× 4的混合矩阵混合成3路观测信号(如图2),其中随机产生的混合矩阵为

    图2 3路观测信号

    使用本文提出的基于3阶统计量的算法对上述欠定盲源分离问题进行求解,求得混合矩阵

    评估发现,估计误差为–27.4030 dB。恢复的源信号如图3所示,源信号的估计值和真实值之间的皮尔逊相关系数的绝对值为0.9757,恢复的源信号和真实源信号十分接近。

    图3 恢复的源信号

    5.3 性能比较

    本文在观测信号的信噪比取不同值时,与常见的欠定盲源分离算法的性能进行了比较,进一步验证了本文提出的算法的有效性。为克服混合矩阵的随机性对实验结果的影响,通过1000次蒙特卡罗实验,产生1000个3×4的混合矩阵,并将源信号混合成1000组观测信号,计算相关算法性能的平均值。其中,与原文中参数设置一致,文献[13]中参数∆θ=0.8◦,文献[17]和文献[18]中延时步长为0.125 ms,延时数量为10。1000次蒙特卡罗对比实验结果如图4所示,从图中可以看出,随着信噪比的降低,6种算法对混合矩阵估计的准确率逐渐提高。基于2阶或高阶统计量的估计方法,在信噪比大于15 dB后性能基本稳定,例如本文所提方法在信噪比为15 dB和30 dB时,对混合矩阵的估计误差分别为–20.3548 dB和–20.0518 dB。基于信号稀疏性的欠定盲源分离算法在信噪比大于10 dB后,随着信噪比增加性能迅速提升,例如文献[14]算法在10 dB, 20 dB和30 dB时,对混合矩阵的估计误差分别是–5.3294 dB, –11.6122 dB和–17.7624 dB。主要原因是在当混合信号受到噪声干扰时,信号的稀疏性受到较大影响,信号稀疏性的假设不再成立。然而,在现实的信号采集过程中,信号极易受到噪声影响。以脑电信号为例,其强度只有微伏级,很容易受到肌电、眼电等非脑信号的干扰。本文提出的算法具有较强的抗干扰能力,能够准确地估计混合矩阵。本文的重点为混合矩阵的估计,而信号恢复可参考期望最大算法、稀疏编码等方法[14,16]。鉴于此,基于上述混合矩阵的估计,本文使用广义高斯模型和期望最大算法进行信号恢复,结果如表2所示。当信噪比较低时,平均皮尔逊相关系数较小。例如,当信噪比为–5 dB时,提取出的源信号与真实值有较大差别,MAPCC在0.3附近,所恢复出的信号无使用价值。随着信噪比的升高,信号恢复效果逐渐变好。本文所提算法在信噪比为30 dB时,MAPCC可达0.88,与其他算法相比,取得了最优性能。

    表2 各算法恢复出的源信号与真实源信号间的平均绝对皮尔逊相关系数

    图4 欠定盲源分离算法混合矩阵估计的归一化均方误差比较

    为了探究本文算法的性能随观测信号数目和源信号数目的变化规律,本文比较了当观测信号数目为3时,在源信号数目不同时算法的性能及当源信号数目为7时,在观测信号数目不同时算法的性能,结果分别如图5(a)和图5(b)所示。当观测信号数目一定时,源信号数目越多,混合矩阵中待估计参数越多,估计难度越大。当源信号数目一定时,随着观测信号数目增多,用于估计混合矩阵的统计信息越充足,估计越准确。

    图5 源信号和观测信号数目变化时,算法的性能

    为了探究算法的时效性,本文进行了1000次蒙特卡罗实验,随机产生1000个混合矩阵,并选择在信噪比为30 dB时计算各算法平均运行1次所需要的时间,其结果如表3所示。本文算法平均运行1次仅需要1.2 ms,显著少于文献[13–16]中的算法,与文献[17,18]所需时间相似。文献[13–16]基于信号的稀疏性实现混合矩阵的估计,对应算法的耗时主要取决于筛选单数据源点所需的时间。其中,文献[13,14]根据信号在时频域中对应时频点(time-frequency point)的实部和虚部向量是否共线,筛选单信号源点,该类算法所消耗的时间和信号长度成正比;
    文献[15,16]计算信号在时频域中每个点与其他点的距离,通过合理设置阈值,筛选出单信号源点,该类算法所消耗的时间和信号长度的平方成正比。文献[17,18]和本文算法则通过观测信号的统计量构建张量,并通过张量分解求解出混合矩阵,该类算法中主要是张量分解比较耗时,受信号长度影响不大。

    表3 各种算法平均运行1次所需要的时间(s)

    针对欠定情形下的混合矩阵估计问题,研究人员多通过稀疏理论来展开,而忽略了噪声自身的统计特性及其对信号稀疏性的影响。本文围绕欠定盲源分离中的混合矩阵估计,提出了一种基于信号3阶统计特性的欠定盲源分离算法。利用源信号的自相关特性,构建3阶张量,并将不同时延对应的3阶堆砌成4阶张量,进而通过典范双峰分解和奇异值分解实现混合矩阵的估计。1000次蒙特卡罗实验表明,本文所提算法可以有效抑制噪声的影响、克服对信号稀疏性的约束,提升混合矩阵的估计精度,并在此基础上实现源信号恢复。然而,需要指出的是,源信号数目和混合矩阵的估计是当前欠定盲源分离研究的两大挑战。现有的欠定盲源分离方法多假设源信号数目已知,而忽视了源信号数目对混合矩阵估计结果的影响,这无疑会造成实际运用时的难度。后续的研究中,作者拟引入贝叶斯网络和期望最大算法等技术手段,以进一步提高源信号数目和混合矩阵估计的准确性。

    猜你喜欢 张量数目信噪比 两种64排GE CT冠脉成像信噪比与剂量对比分析研究现代仪器与医疗(2022年1期)2022-04-19一类张量方程的可解性及其最佳逼近问题 ①西南师范大学学报(自然科学版)(2022年1期)2022-03-02移火柴小猕猴智力画刊(2021年6期)2021-08-05严格对角占优张量的子直和华南师范大学学报(自然科学版)(2021年3期)2021-07-03一类张量线性系统的可解性及其应用宁夏师范学院学报(2021年1期)2021-03-18四元数张量方程A*NX=B 的通解五邑大学学报(自然科学版)(2020年4期)2020-12-09自跟踪接收机互相关法性能分析舰船电子对抗(2020年1期)2020-04-27基于深度学习的无人机数据链信噪比估计算法北京航空航天大学学报(2019年9期)2019-10-26低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像雷达学报(2017年3期)2018-01-19牧场里的马作文大王·低年级(2016年3期)2016-03-11
    相关热词搜索: 分离 统计 方法

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章