美国密西西比州立大学电子与计算机工程系杜谦教授:对抗性自动编码网络在高

对抗性自动编码网络在高光谱异常检测中的应用

杜谦1,谢卫莹2

1.美国密西西比州立大学电子与计算机工程系,密西西比39762;
2.西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西西安710071

基金项目:国家自然科学基金(62121001;U22B2014);中国科协青年人才托举工程(2020QNRC001)

摘要:自动编码器(autoencoder,AE)是一种典型的生成模型。由于它具有简单的学习过程、良好的收敛能力和无监督的特性而得到了广泛的应用。AE的目标函数仅是输入输出之间的重构误差。为了提高其性能,提出了对抗性自动编码器(adversarialautoencoder,AAE),可以为原始的AE网络提供变分推理输出。本文回顾有关无监督和半监督的AAE模型在高光谱异常检测(hyperspectralanomalydetection,HAD)中的应用。除了在隐层空间中使用对抗性学习外,还可以通过在编码器的输入和解码器的输出之间添加对抗性学习来提高AAE的性能;通过这种方式,改进后的AAE网络可以更专注于学习数据分布而不仅是点对点的数值重建。试验结果表明,利用这些深度学习模型完成HAD任务的想法超越了传统HAD方法的概念,显著提高了检测性能。

关键词:高光谱影像异常检测自动编码器对抗性自动编码器对抗学习

引文格式:杜谦,谢卫莹.对抗性自动编码网络在高光谱异常检测中的应用[J].测绘学报,2023,52(7):1105-1114.DOI:10.11947/

DUQian,[J].ActaGeodaeticaetCartographicaSinica,2023,52(7):1105-1114.DOI:10.11947/

阅读全文:

引言


[1]。基于这些应用,衍生出各种数据分析方法,包括场景分类[2]、目标检测[3]和异常检测(anomalydetection,AD)[4]等。其中,异常检测作为一种特殊的目标检测方法,可以在无先验知识的情况下,从复杂背景中提取具有异常光谱信息的目标。由于异常目标的出现概率往往远低于背景的出现概率[5],因此成功进行异常检测的关键在于建立有效的背景模型或异常-背景分离模型。在实践中,高光谱异常检测(hyperspectralanomalydetection,HAD)面临着许多挑战,其中包括缺乏目标先验信息、背景类别复杂多样、样本数量不平衡及背景标签不准确等问题。

传统主流的HAD算法可以大致分为两类:背景建模和背景去除。最著名的背景建模算法是Reed-Xiaoli(RX)检测器[6]。基于背景服从高斯分布的假设,RX检测器通过估计样本的均值和方差来构建图像的背景模型。文献[7—8]中有许多RX检测器的改进版本。例如,与全局RX(globalRX,GRX)相比,局部RX(localRX,LRX)检测器[7]在本地窗口中进行背景建模,并通过预处理方式减少了背景样本的污染[8]。近年来,有学者提出了基于数据表示的背景建模算法。例如,基于协同表示的检测器(collaborativerepresentationdetector,CRD)[9]假设背景中的每个像素都可以被其邻域像素的线性近似所表示,如果表示误差较大,则表明该像素很可能是异常点。CRD在建立背景模型时,是通过假设邻域内的所有像素都参与了对中间像素的表示来实现的,而稀疏表示检测器[10]则用稀疏表示代替了协同表示,只采用了最具代表性的局部背景像素来构建背景模型。最新的CRD变体,如基于自加权协同表示的检测器(self-weightedcollaborativerepresentation-baseddetector,SWCRD)[11],则进一步考虑了不同波段在背景协同表示中的重要性。此外,低秩表示检测器,如基于稀疏低秩矩阵分解的马氏距离高光谱异常检测(LRaSMD-basedMahalanobisdistancemethodforhyperspectralanomalydetection,LSMAD)[12],成功建立了具有充分探索低秩性质的背景去除模型。最近,文献[4]提出了一种结合低秩和稀疏矩阵分解的混合噪声模型,以准确描述并去除噪声分量。背景去除算法还包括属性和边缘保留滤波(attributeandedge-preservingfiltering-basedanomalydetection,AED)[13],结构张量和引导滤波(structuretensorandguidedfifilter,STGF)[14]。最近,分数傅立叶熵(fractionalFourierentropy,FrFE)也被引入到HAD中[15]。在亚像素-像素-超像素引导融合检测器(subpixel-pixel-superpixelguidedfusion,SPSGF)[16]中,使用了不同像素级别的特征融合。基于子空间选择判别森林方法(subspaceselection-baseddiscriminativeforest,SSDF)[17]借用隔离的概念以减少背景污染。然而,在多样的真实场景和应用中,复杂无先验知识的背景仍限制了这些基于传统HAD方法的检测性能。

基于深度学习的方法可以提取非线性和深度特征,通过层层组合实现复杂函数逼近。深度学习也已经运用到AD中[18-20]。通常,根据标签的可用性,基于深度学习的AD模型大致可以分为3个类别:监督、半监督和无监督[21]。监督学习模型在理论上可以提供出色的检测性能,然而在遥感领域的应用中存在一些问题,例如不稳定的大气环境、不准确的像素级标签和不可用的先验知识等[22]。所以,无监督和半监督AD方法更适用于遥感领域中的HAD任务。无监督方法由于不需要任何标签信息,因此具有实际的应用价值。尤其是一些生成模型,如自动编码器(autoencoder,AE)[23]和生成式对抗网络(generativeadversarialnetwork,GAN)[24],已经成为无监督AD模型的基础。例如,文献[25]使用对抗性AE,也就是AAE(adversarialautoencoder,AAE),提取隐层中的深度特征以用于异常检测。虽然隐层的特征提取可以减少维度,但由于缺乏局部属性,它们不能很好地反映HSI的内在结构。因此,取而代之的是端到端无监督异常检测,它不依赖于中间隐层的特征提取。例如,通过将学习到的流形约束施加于隐层并结合AE的重建误差,提出了基于流形约束的自编码器网络检测器(manifoldconstrainedAEnetwork,MC-AEN)[26]。这种方法可以充分利用HSI的内在结构以提高HAD的性能。基于光谱学习的判别重构方法(discriminativereconstructionwithspectrallearning,SDLR)[27][31]是首个尝试将GAN用于HAD中进行背景建模的研究。文献[32]将卷积神经网络(convolutionalneuralnetwork,CNN)应用在针对HAD的迁移学习中。基于神经网络和字典的低秩检测器(neuralnetworkanddictionary-basedlow-rankDetector,NNDLR)[33]则使用CNN提取丰度图。上述无监督AD方法可以映射没有任何先验信息的高维数据分布[34];然而,缺乏先验知识使得它们很难进一步降低虚警概率和提高检测精度。因此,半监督AD方法通过预处理搜索出背景标签的步骤,可以使背景模型更加准确,背景去除更加有效[35-36]。然而,在半监督AD中,为了获取预期的仅来自背景的纯净训练样本,预处理过程会变得更加复杂。

1自动编码和对抗自动编码网络

1.1自动编码器

AE是一种无监督的神经网络架构,旨在将给定的样本x映射到用于重建的输出。它通过编码器函数f:x→z将输入样本转换为隐代码z,然后通过解码器函数g:z→

美国密西西比州立大学电子与计算机工程系杜谦教授:对抗性自动编码网络在高

(1)

由于AE的无监督特性,通常会将所有像素作为AE的训练样本。在训练结束后,AE的输出或隐代码可以被用于异常检测[37]。假设经过训练的AE可以很好地重建占据大部分数据点的背景信息,而异常像素会导致较大的重建误差从而在输出端被检测出来。然而,在实际应用中发现,如果异常像素也包含在训练数据中,那么这些像素将具有低重建误差以致不能被有效地检测为异常[37]。隐层信息也可用于异常检测,因为异常像素原则上也具有不同于背景的隐层输出。无论是利用网络输出或是隐代码,基于AE的异常检测性能都会因训练数据集包含异常信息而降低。


1.2生成式对抗网络


GAN[38]作为最流行的生成模型,旨在通过学习所提供的数据分布来生成具有一些变化的新数据点。它包含两个对抗性组件,一个生成器G和一个判别器D。生成器G尝试将具有概率分布pz的输入数据z映射为具有概率分布pg的预期数据,使该概率分布接近真实的数据样本x的概率分布pdata。判别器D有两个输入样本:概率分布为pdata的真实数据样本,以及概率分布为pg的生成数据样本,并试图辨别出其中的真实样本。生成器G试图生成使判别器D无法辨别的虚假样本,而判别器D则希望辨别出虚假样本。直到D无法分辨其输入数据为真实样本还是虚假样本时,说明G成功生成了所需的数据分布,这也意味着G和D在使用下述min-max目标函数时取得了平衡

(2)

式中,V(G,D)是交叉熵损失函数。判别器D旨在最大化真实样本的输出,同时最小化生成样本的输出。而生成器G为了混淆D,需要最大化生成样本的判别概率D(G(z)),即最小化ln(1-D(G(z)))。在训练过程中,G和D被重复交替训练。当G和D达到均衡时,pg(x)与pdata(x)非常接近,这意味着很难将生成样本与真实样本区分开来。

训练好的GAN也可以用于异常检测。如果生成样本能很好地表征背景信息,那么输入的异常点可以很容易地被D区分出来。但如果训练样本不纯,基于GAN模型的异常检测性能也会下降。


1.3对抗性自动编码器


AAE[39]

AAE利用GAN将AE的隐代码的后验分布与先验分布进行匹配,从而实现变分推理,这使得AE的性能可以通过对抗性损失得到提升。AAE现已成功应用于灰度和彩色图像的异常检测[37,40-41]。

2基于对抗性自动编码器的HAD

由于AAE具有强大的表示能力,可以利用它从高维光谱向量中挖掘光谱的内在特征。在改进原网络架构的设计时,需要考虑高光谱图像的独特性。因此,基于AAE的异常检测方法在使用来自隐层、解码器和/或判别器的输出数据时会有所差异。除上述方法外,还可以将对抗性学习加在AE的输入输出端。此外,也可以通过预处理过程提取潜在的纯背景样本以进行半监督检测,或是在网络训练中加入预估的背景-异常分离正则化约束以近一步提升半监督检测性能。


2.1无监督HAD


2.1.1谱对抗特征学习模型


如图1所示,谱对抗特征学习(spectraladversarialfeaturelearning,SAFL)模型[25]是直接使用原始AAE架构的无监督异常检测神经网络。对于给定的高光谱数据矩阵H,SAEL网络的编码器部分学习将输入数据H映射为隐代码Zfake,而解码器部分负责根据隐代码Zfake重构H。判别器的训练使用对抗性学习,以区分其输入数据是由编码器生成还是从先验正态分布Zreal中采样所得。判别器和编码器在训练阶段组成一个GAN,编码器变成生成器,以确保生成的隐代码可以混淆判别器。判别器D旨在最大可能地区分其输入来自编码器或先验正态分布,而生成器G(编码器E)试图最小化这个目标。因此,总的目标函数可表示为

(3)

图1谱对抗特征学习(SAFL)模型

(SAFL)

图选项


模型训练完成后,通过形态属性滤波和平均融合去除背景信息并增强异常目标,从而得到最终的异常检测结果。


2.1.2约束GAN模型

由于无监督学习的局限性,直接使用原始AAE架构的SAFL模型的检测性能有限。因此,在约束GAN(constrainedGANforHAD,HADGAN)模型[28]中,除了使用AE输入输出之间的重构误差和隐层的对抗性学习之外,还增加了AE的输入H和解码器(De)的输出De(Z)之间的对抗性学习。这样的改进使得AE的训练更专注于重建多数类(即背景像素)的分布,而不是只进行点到点之间的数值重建。如图2所示,在HADGAN模型中,包含了两个判别器:用于隐层对抗性学习的Dz和用于输入输出间对抗性学习的DI。新增的对抗性学习的目标函数可表示为

(4)

图2约束GAN(HADGAN)模型

(HADGAN)

图选项


这样,HADGAN的总目标函数包括3部分:AE输入输出之间的重构误差,隐层的对抗判别误差(式(3)),以及输入输出之间的对抗判别误差(式(4))。在HADGAN模型训练完成后,传统的RX算法可以应用于重构误差输出,以实现异常检测。


2.2半监督HAD


2.2.1半监督背景估计模型(SBEM)


为减少异常点在训练过程中产生的污染和干扰,半监督HAD利用预处理过程将潜在的异常点去除,获得较纯净的背景样本用于模型训练。假设高光谱数据矩阵包含背景矩阵B和目标矩阵A,也就是H=[BA],所预估的背景为Bs。有关Bs的预处理过程,可以采用粗略的异常检测如全局RX(GRX)、K均值聚类、空间滤波等方法,这里不再赘述。

如图3所示,半监督背景估计模型(semi-supervisedbackgroundestimationmodel,SBEM)[36]省略了隐层的对抗学习,只保留了AE输入输出之间的对抗学习以及最小化重构误差。在对抗性学习过程中,判别器的输入是输入到编码器的背景光谱向量Bs和解码器的输出。通过对抗学习,的数据分布可以更接近Bs的数据分布。由于训练样本只包含背景像素Bs,SBEM是一个更纯粹更有效的背景估计模型。

图3半监督背景估计模型(SBEM)

(SBEM)

图选项


在SBEM训练完成之后,如果将异常点输入到该模型中,将产生很大的重构误差。在这里,可以将RX算法再应用于重构误差,以提高异常检测输出值。


2.2.2背景-异常分离GAN(BASGAN)


为了进一步提高半监督HAD的性能,在背景-异常分离GAN(background-anomalyseparabilitywithgenerativeadversarialnetwork,BASGAN)[42]模型中,增加了有关背景-异常分离的约束条件。也就是说,AE的背景重构不仅需要误差最小,还需要和预检测出的异常点的L2距离最大。相关的目标函数可表示为

(5)

式中,bi和分别表示AE的第i个输入和输出的背景向量;和a分别是AE输出的背景向量的均值和预检测的异常向量的均值;λ为正则化参数。

除了最小化重构误差和最大化背景-异常分离度以外,如图4所示,BASGAN还保留了传统AAE中的隐层对抗学习,以及HADGAN和SBEM中的AE输入输出间的对抗学习。

图4背景异常分离GAN(BASGAN)模型

(BASGAN)

图选项

3试验结果

HYDICE和SanDiego数据集用于展示基于AAE的无监督和半监督HAD的性能。

(1)HYDICE数据集描述了美国的一个城市场景,由HYDICE机载传感器捕获。原始图像尺寸为307×307,具有162个光谱通道,范围为400~2500nm。从整个原始图像中裁剪出空间大小为80×100的子图像,用于高光谱异常检测。至于光谱波段,保留的162个波段为有用信息,其他低信噪比的波段已被去除。异常像素点总数为19个,占总像素的0.2375%,分别对应汽车和屋顶。该数据集的彩色合成图及其对应地面实况图如图5所示。

图5HYDICE数据集

图选项


(2)SanDiego数据集由AVIRIS机载传感器捕获,其空间分辨率为3.5m,光谱分辨率为10nm。它覆盖美国加利福尼亚州SanDiego机场区域。机场中134个有关飞机的像素被视为要检测的异常点。数据集的原始空间大小为100×100,光谱波段数为224。在去除了低信噪比波段后,189个波段被保留下来用于异常检测。该数据集的彩色可视化图片及其对应的地面实况图如图6所示。

图6SanDiego数据集

图选项


试验中,模型使用的编码器、解码器及判别器的深度为3;全连接层含500个神经元;隐层含20个神经元。在使用随机梯度下降法进行网络训练时,编码器和解码器的学习率是0.001,而判别器的学习率为0.0001,训练总次数设为10000。在BASGAN中,背景-异常分离约束的正则化参数λ选为0.05。试验调试结果表明,这些超参数的选择可提供较为优异的检测性能。

图7显示了AE、AAE、SAEL、HADGAN、SBEM和BASGAN等模型在HYDICE试验中所产生的异常检测结果图。基于重构误差的AAE异常检测结果略优于AE。以前的研究结果表明,原始的AE和AAE在检测性能上并不明显优于传统的HAD算法,如RX、CRD等[25,42]。图7中,HADGAN的背景抑制能力明显优于SAEL;半监督SBEM和BASGAN的结果明显好于无监督方法;其中,BASGAN通过在重构过程中引入背景-异常分离约束条件,使得检测效果得到了进一步的提高。同样的,在图8有关SanDiego试验所产生的异常检测图中,HADGAN、SBEM和BASGAN模型因增加了AE输入输出的对抗训练过程,使得背景抑制效果得到显著改善;半监督SBEM和BASGAN的结果好于无监督方法;BASGAN的检测效果最佳。

图7HYDICE试验所产生的异常检测

图选项


图8SanDiego试验所产生的异常检测

图选项


为进一步量化检测结果,首先估算了每个检测结果的虚惊概率pf和检测概率pd,并画出了它们的接收器工作特性(receiveroperatingcharacteristic,ROC)曲线。然后计算曲线下面积(area-under-curve,AUC),面积数越大表示检测性能越好。图9是6种方法在HYDICE和SanDiego数据集上的ROC曲线。由图6可以看出,BASGAN和SBEM优于HADGAN和SAEL,HADGAN和SAEL优于AAE和AE。如表1所示,AUC结果也与图7和图8中的检测结果相吻合。另外,检测结果图中的异常-背景分离情况如图10所示。红色框表示异常的分布,而蓝色框表示背景分布。如果像素的统计分布值介于同类别的10%~90%之间,就被包括在框内,而顶线和底线分别代表该类别的最大值和最小值。背景框和异常框的位置及分布反映了探测器的检测性能:相距越远并且异常的底线部分和背景的顶线部分没有重叠或重叠很少,就说明检测性能更优越。显然,BASGAN可以更清晰地将异常从背景中分离出来。

图9HYDICE和SanDiego数据的ROC曲线

图选项



表1异常检测AUC结果比较

(AUC)ofROC


表选项


图10HYDICE和SanDiego数据的异常-背景分离

图选项

4总结和展望

通过引入GAN对抗训练的优势,AAE对AE网络结构进行了改进。AAE并不局限于输入数值重构,它通过在隐层加入有关先验分布的对抗学习,为AE网络提供变分推理输出。鉴于高光谱遥感图像背景的复杂性,现有的工作除了在隐空间进行对抗性学习之外,还通过在编码器的输入和解码器的输出之间添加对抗性学习,使AAE网络可以更专注于学习原始数据分布而不仅是点对点的数据重建。如果在预处理过程中提取纯背景样本以进行半监督检测,改进的AAE网络可以更好地生成与包含异常的原始图像相对应的无异常背景图像,从而使得异常检测性能大大提升。

使用这些深度学习模型的HAD方法突破了传统HAD的思路,值得进一步探讨。尽管深度网络训练时间长,但训练之后的模型在检测时间上与传统方法类似。如何将迁移学习引入这些深度学习模型,使模型具有领域适应性将是下一步研究的重点。

第一作者简介:杜谦(1971—),女,博士,教授,博士生导师,研究方向为遥感图像处理和分析,多传感器信息融合,机器学习等。E-mail:qdu2004@

通信作者:谢卫莹,E-mail:wyxie@

初审:张艳玲

复审:宋启凡

终审:金君

资讯

发布于 2025-08-23 09:05
923
上一篇:年关!情绪价值拉满,数码桌搭4大方案请查收 下一篇:「上手」华为平板M6体验:可以是影音工具,也可以是儿童平板
目录

    推荐阅读