卓尔文档网 - www.qiying88.com 2024年05月17日 19:10 星期五
  • 热门搜索:
  • 当前位置 首页 >范文大全 > 公文范文 >

    基于深度学习的阵列信号测向方法综述

    来源:网友投稿 发布时间:2024-01-15 17:00:11

    吴流丽,苏怀方,王平,季伟,刘筱明

    (中国人民解放军61660部队,北京 100089)

    阵列信号测向,也称到达方向(DOA)估计,广泛应用于雷达、无线通信和天文学等领域[1-11]。传统测向方法可分为波束形成类[3-4]、子空间类[5-6]、最大似然类[7-8]和稀疏重构类[9-11]等。在实际应用中,往往要求测向方法能够适应复杂多变的信号环境和应用环境并能够进行快速(实时)测向,然而上述传统测向方法通常无法满足这些需求[12]。

    近年来,以深度学习(DL)为代表的人工智能技术飞速发展,基于DL的阵列信号测向技术越来越受到关注,并成为测向领域新的研究方向。运用DL进行信号测向的本质是从观测信号中提取含有信号源入射角度的特征,并利用DL模型在该特征与信号角度参数之间建立一种非线性映射关系从而完成测向。此类方法突破了传统测向方法对各种误差适应能力弱的缺陷,并可实现近实时估计,其低信噪比适应能力、空间角度分辨能力也得到了相应的增强。

    本文主要对近年来DL在阵列信号测向领域的应用成果进行整理和归纳,并总结出DL类测向方法的一般处理框架,然后对该处理框架的具体实现步骤进行详细的介绍和讨论,最后对未来发展方向进行了展望。

    1.1 信号观测模型

    假设K个窄带不相关的远场信号s(t)=[s1(t),…,sK(t)]T分 别 以 角 度ϕ=[ϕ1,…,ϕK]同 时入射到由M个增益为1的各项同性阵元所组成的阵列上,阵元之间无互耦和通道不一致的干扰。则阵列输出矢量x(t)=[x1(t),…,xM(t)]T可表示为:

    式中,A(ϕ)=[a(ϕ1),…,a(ϕK)]是K个入射信号对应的阵列响应矩阵,a(ϕk)表示角度ϕk对应的阵列响应矢量;
    v(t)=[v1(t),…,vM(t)]T为观测噪声,通常假设各阵元的观测噪声为零均值高斯白噪声,且不同阵元不同时刻的观测噪声相互独立。

    若阵列接收机共采集了N组快拍数据,即t=t1,…,tN,则阵列输出矩阵 X=[x(t1),x(t2),…,x(tN)]可写为:

    式 中,S=[s(t1),…,s(tN)]为信号波形矩阵,V=[v(t1),v(t2),…,v(tN)]为观测噪声矩阵。阵列测向就是利用观测数据X估计参数ϕ的过程。

    式(1)、式(2)所示观测模型为窄带条件下的一般模型,在宽带信号、阵列误差、稀疏条件下,该模型应作相应修正[10-12]。

    1.2 深度学习概述

    DL是机器学习的一个分支,其本质是基于深度神经网络(DNN),从Q个输入/输出训练对中D={[Xq,Ψ(Xq) ;
    q=1,…,Q}自动学习非线性函数Ψ(·)。一般而言,DNN可分为3个基本的部分:输入层、隐藏层和输出层。其中,输入层的神经元用于接收输入数据X,并将其传输到隐藏层的各神经元;
    隐藏层中的神经元利用激活函数处理数据,并将处理后的数据传到输出层;
    最后由输出层的神经元输出结果Ψ(X)。在 DNN 中,隐藏层的层数越多,结构越复杂,其表示能力也就越强,学习得到的非线性函数Ψ(·)就越逼近真实函数Ψ(·),因而 DNN 相较于传统浅层神经网络具有更强大的性能。

    目前已经提出了多种DNN结构,如自动编码器、前馈神经网络、环神经网络、卷积神经网络等。

    图1给出了利用DL实现阵列测向的总体处理框架,所示框架事实上是将监督学习用于阵列测向的一种十分直观的做法,几乎可以涵盖目前所有基于有监督学习的阵列测向方法。其中“阵列模型”即对应1.1节的阵列信号观测模型,包含了阵列测向中所需的所有基本设置和相应参数,如阵列构型、阵元个数、应用场景、信号环境等。

    图1 基于深度学习的阵列测向处理框架

    图1中虚线箭头表示训练阶段的数据流向,实线箭头表示测试/测向阶段的数据流向。虚线框内即为DL类阵列测向方法的核心部分,涉及预处理、DL模型、数据后处理3个部分。目前将DL技术应用于阵列测向所取得的一些初步成果也基本上是围绕这3个部分开展,下面对这3个部分进行详细介绍和总结。

    2.1 预处理

    阵列原始接收数据X中包含信号的全部信息,但X∈CM×N维数过高,且包含很多与信号角度参数ϕ无关的冗余信息,如信号的波形、调制样式、频率带宽等。

    预处理的目的是希望找到一个合适的变换r=F(X),在尽可能保留信号角度信息的基础上,减少输入r的维数,从而降低训练复杂度、加快学习收敛速度、减少训练时间。因此,数据预处理的方式会直接影响DL模型的构建以及角度估计的性能。

    部分基于DL的测向文献也将预处理过程称为特征提取,常用的特征有:时差[13]、相位差[14-15]、功率测量值[16]、广义互相关矩阵[17]、信道状态信息(CSI)[18]、协方差矩阵[19]等。其中,最常用的特征就是协方差矩阵R。对于上文的观测模型,阵列输出的协方差矩阵为:

    式中,Rs=diag[η1,…,ηK]和Rv=σ2IM分别表示信号协方差矩阵和噪声协方差矩阵。diag[·]表示以给定序列作为主对角线生成对角矩阵;
    ηk为第k个信号的功率;
    σ2为噪声功率;
    IM为M×M的单位阵。

    从式(3)可看出,窄带信号条件下阵列协方差矩阵R∈CM×M消除了阵列原始数据X中信号波形等因素的干扰,同时保留了入射角度ϕ的全部信息,其维数也降低了(N>M时)。

    考虑到R是共轭对称矩阵以及其对角线元素与信号入射角无关,一般只需利用R的上(或下)三角部分元素(不含对角线):

    式中,rˉpq=Rp,q为R的第(p,q)个元素。

    由于式(4)中rˉ为复数矢量,因此实际学习过程中需要将复数分为实部和虚部两部分,并将其归一化处理后作为DL模型的输入:

    协方差矩阵作为DL输入特征性能稳健,是目前使用最广泛的特征;
    然而它也存在一些固有缺点,如输入-输出空间曲面映射关系不够清晰、维数仍较高、与信号频率/带宽等参数相关等。在此基础上,研究人员根据不同的应用场景提出了一些改进特征[20-22],在不损失角度信息的情况下进一步减少r中的冗余信息,提高训练效率。

    2.2 深度学习模型

    2.2.1 深度学习测向原理

    如图 1所示,DL模型旨在通过训练集D={[Xq,ϕq] ;
    q=1,…,Q},近似模拟输入输出之间的非线性映射关系y=Ξ(r),其中,r为深度学习模型的输入,其通过对阵列观测数据X进行预处理得到,y代表深度学习模型的输出,其经过处理可得DOA向量ϕ。

    根据y的类型,DL类信号测向方法可分为两大类:基于分类模型的信号测向方法和基于回归模型信号测向方法。

    1) 基于分类模型的信号测向

    将信号入射空域按照一定的角度间距划分为若干个不相交的区间,例如将[-90°,90°)以1°的间隔划分为[-90°,-89°),[-89°,-88°),…,[89°,90°)共180个角度区间。同一个区间内的角度视为同一类别,而不同区间的角度对应不同类别,共对应180类。则阵列测向问题可等效为判断阵列观测数据来自于哪一个角度区间的问题,DOA估计转化为多类别分类。

    基于分类模型的信号测向方法基本原理为:在训练阶段利用若干训练样本训练分类器。训练完成后,当一个角度未知的信号输入到该分类器时,分类器输出该信号的类别标签,完成测向。该类方法原理简单,易于理解,而且DL在分类问题上已取得了非常瞩目的成就,可供借鉴和利用的工具非常多。但它也面临着一些问题如:

    ① DOA估计结果是离散的值,估计精度受到空域划分间隔的影响,无法达到无偏估计。

    ② 当存在多个信号同时入射时,同一个阵列输出样本对应多个类别标签,如2个信号分别从-15°和30°方向同时入射,则该阵列输出样本同时属于-15°和30°类别。这是机器学习中近年来相当活跃的一个研究领域——“多标记学习”,这与常规的分类问题已有较大的区别。

    目前利用基于分类思想的文献[23-27]主要应用于室内定位等对测向精度要求不高的场合。许多研究[28-30]致力于缓解现有分类模型的缺点,其中应用最广泛的改进策略是使用0-1向量来代替类标签作为DNN的输出。将每一个角度区域用一个输出节点表示,并对输出节点进行0-1 编码。在训练阶段,若某个角度区域内存在入射信号,则该区域对应的输出节点输出值为1,否则输出值为0。在角度估计阶段,当一个未知角度的样本输入到该网络时,测向网络在各输出节点输出相应的值,构成“空间谱”。

    与分类模型相比,0-1 编码模型可通过对空间谱进行后处理得到连续的角度值,估计精度有所提高;
    而且该模型还可以方便地处理同时入射的多个信号。

    2) 基于回归模型的信号测向

    该类方法测向思路是假设到达角度ϕ与输入特征r之间存在某种函数映射关系ϕ=Ξ(r),通过深度回归模型得到这种非线性映射关系的近似(·),从而完成DOA估计=(r)。

    回归模型的优点是DOA估计结果连续且能达到较高精度。缺点是非线性映射关系Ξ(·)影响因素多、形式通常较为复杂,往往需要大量的样本才能得到较好的近似;
    而且在处理多信号角度估计时,需要先预估信号个数,并建立多个函数映射关系[31]。

    2.2.2 深度学习测向结构

    DNN 是基于DL的信号测向的核心部分。在DL领域已经提出多种DNN结构,如循环神经网络、LeNet、LSTM、AlexNet、残差网络(ResNet)等,同时新的DNN结构不断被提出以适应特定的学习目的和要求。DNN的性能跟很多因素有关,例如隐藏层的数量、每层中的神经元数量、每个神经元的激活函数等,目前DOA估计领域的研究人员尚未就如何选取最合适的DNN结构达成一致。在这一小节中,简要梳理现有用于DOA估计的DNN结构。

    1) 全连通神经网络(FCNN)

    FCNN是一种直接前馈神经网络,其2个相邻层中的神经元完全连接。文献[37-39]中引入了FCNN来解决DOA估计及其相关问题。

    2) 卷积神经网络(CNN)

    CNN是目前应用最广泛的DNN框架之一。它采用卷积数学运算来替换FCNN中的矩阵乘法。CNN适用于处理网格格式的数据,并在许多应用中取得了巨大成功,包括DOA估计[40]。一些改进结构如残差网络[41-42]等也陆续应用于DOA估计以进一步增强性能。

    3) 循环神经网络(RNN)

    RNN是除CNN之外的另一种综合神经网络,其设计用于处理序列数据。RNN的神经元不仅接收来自前一层神经元的信息,还接收来自自身相邻历史状态的信息。为了克服了原始RNN的许多缺点,一些改进算法相继被提出,例如LSTM和GRU等。其中一些RNN结构已经成功地用于解决DOA估计问题,如在文献[43]中,协方差矩阵序列R输入到基于LSTM的RNN以估计信号源方向。

    4) 卷积循环神经网络(CRNN)

    CRNN结合了FCNN、CNN和RNN 3种结构,以综合利用每种神经网络的优势。文献[44-45]提出利用CNN和RNN构建不同的CRNN以获得改进的DOA估计性能。

    5) 混合神经网络

    阵列输出和DOA的之间映射关系受许多变量的影响,单类DNN很难在所有条件下都具有良好的泛化能力。因此,一些研究人员将 DOA 估计分解为一系列子任务,并采用多个级联或者并行的DNN分别完成子任务,最终进行组合完成DOA估计。例如,文献[46]提出了一种用于DOA估计的两阶段级联神经网络,它在第一阶段使用CNN粗略估计DOA,在第二阶段使用FCNN细化调整DOA估计值。文献[31]提出了一种混合DNN结构,该DNN由3部分组成:用于噪声滤波的自动编码器、用于信号数检测的FCNN和用于DOA估计的一系列并行有向无环图(DAG)。文献[47]首先将阵列测量值输入到SNR测量网络以评估阵列输出的SNR,然后从一系列候选DOA估计DNN中调用与该SNR相对应的DNN网络,以解决不同信噪比条件下DOA估计问题。

    6) 复值神经网络(CVNN)

    在实际测向系统中,阵列的输出为既有实部也有虚部的复数。因此,一些研究人员提出用CVNN以更好地处理复值阵列输出。与实值DNN相比,CVNN包含复数权重参数并执行复数运算,以从阵列输出中提取与DOA相关的信息。文献[41]证明在某些情况下CVNN可以提高DOA估计性能。

    7) 迁移学习(TL)和无监督学习

    在实际测向系统中,通常很难收集足够多的有标签数据集。如果只有有限数量的标记数据可用,则很难通过监督学习获得满意的DOA估计性能。为解决这一问题,提出无监督预训练[37](如自动编码器)、半监督学习(SSL)[48]和TL[49]等方法。无监督预训练以无监督的方式从原始阵列输出中提取基本特征,并为实际分类和回归任务中的DNN特征提取模块提供初始权重。SSL利用标记数据和未标记数据来提高模型学习性能。TL通过传递在不同但相关的场景和数据集中共享的知识,减少了模型学习对训练数据量的依赖。

    8) 深度展开网络

    上述基于DL的DOA估计模型以黑盒的形式解决DOA估计问题,通过试错方式优化神经网络参数。最近,研究者提出深度展开网络[50-52]以增强了传统DNN的可解释性。相关的DOA估计方法首先展开一种迭代的稀疏恢复算法,以获得具有可训练变量的信号流图,然后使用监督学习技术调整这些变量,以获得更精确的DOA估计模型。例如文献[50]展开稀疏贝叶斯学习算法,文献[51]展开FPC算法,得到前向神经网络结构。

    2.3 数据后处理

    数据后处理的目的是从DL模型的输出y中得到角度估计值。不同的机器学习模型输出的信息不同,采用的后处理方法也不同。一般而言,基于回归模型的测向方法可直接输出角度,不需要进行后处理。

    对于分类模型,如果最终输出的是各类别的标签,则该类别对应的角度即为信号DOA的估计值。对于0-1编码模型而言,神经网络输出y可视为“空间谱”。一般情况下,y的峰值的位置即对应入射信号角度值;
    然而由于空间谱y是基于离散化的空域角度集形成的,如果直接将y中峰值的位置作为信号的波达方向估计值,会引入一定的量化误差。可以利用线性插值等方法来减小量化误差的影响,以改善估计结果。得到空间谱估计结果y之后,通过下式计算角度估计值:式 中,φk,1和φk,2分 别 为y中 第k个 谱 峰 的 左侧和 右 侧对应的方向值,yk,1和yk,2为和对应的幅度值,作开方处理是因为y代表了各方向上的信号功率而非信号幅度。

    近年来基于DL的测向方法取得了一系列的成果,但还有一些问题需要进一步研究。

    1) 基于DL的方法需要大量标记数据集来训练具有满意性能的DOA估计器。然而,由于实际应用中标记数据集通常难以获取,因此如何减少对标记数据集的依赖是一个重要方向。目前有学者利用无监督学习和TL理念进行了一些尝试,但现有成果与实际需求之间仍存在差距。在实际测向系统中,标记数据在使用过程中逐渐累积,建立可随时间改进的演化模型也是研究方向之一。基于这一目标,可能有必要将强化和增量学习技术引入这一领域,以进一步增强测向性能。

    2) 现有基于DL的DOA估计方法大多是纯数据驱动的,无法利用阵列流形或信号特征的先验知识,例如完全或部分已知的阵列配置、循环平稳特征或入射信号的调制信息等。因此需要进一步研究如何更好地利用这些先验信息。

    3) 在DOA估计领域,许多因素会影响从信号方向到阵列输出的函数映射关系,例如入射信号的数量、信号幅度和波形等。通常不可能枚举所有场景并在每个场景中收集足够的数据来训练通用DNN模型。因此,如何增强基于DL的DOA估计方法的泛化能力值得进一步研究。

    猜你喜欢协方差角度神经网络神奇的角度作文小学高年级(2022年3期)2022-04-20神经网络抑制无线通信干扰探究电子制作(2019年19期)2019-11-23高效秩-μ更新自动协方差矩阵自适应演化策略计算机应用与软件(2019年2期)2019-04-01基于神经网络的中小学生情感分析电子制作(2019年24期)2019-02-23一个涉及角度和的几何不等式链的改进福建中学数学(2018年1期)2018-11-29用于检验散斑协方差矩阵估计性能的白化度评价方法雷达学报(2017年3期)2018-01-19角度不同37°女人(2017年8期)2017-08-12人啊滇池(2017年7期)2017-07-18二维随机变量边缘分布函数的教学探索考试周刊(2016年54期)2016-07-18不确定系统改进的鲁棒协方差交叉融合稳态Kalman预报器自动化学报(2016年8期)2016-04-16

    推荐访问:测向 阵列 综述

    Top