项目算法综述
概述
项目为与某研究所合作项目,项目的目标的实现,对雷达的回波信号和图像信号的检测与识别,整体流程为原始数据通过检测算法得到供识别的数据,再利用机器学习的方法实现检测后数据的特征提取,分类算法,算法融合得到最后得到更加鲁棒的算法。项目的第二步要求是通过统一的软件界面可以实现整理算法的设计与展示。
1 基于机器学习的特征提取方法
1.1 线性方法
线性特征提取方法的问题可以表述如下:
设 为训练样本集,第g类雷达目标包含Ng个训练样本,且 ,C为雷达目标类别总数。线性方法的目的是通过对训练样本集的学习得到一个变换矩阵V,将 空间中的原始样本x变换到一个特征空间中的特征 。机器学习的过程就是寻找变换矩阵V的过程。得到了变换矩阵V,对输入空间 中任一原始样本x进行特征变换的过程可表示为:
1.1.2 核方法
核方法是新近发展起来的一类可有效处理非线性问题的方法,它从理论上为机器学习提供了一种系统而有原则的方法。首先看一个例子,图1-1表示R*R空间中的线性不可分的两类问题,采用上式所示的映射将这两类数据从R*R变化到R*R*R空间:
变换后的结果如图1-2所示。
图1-1 空间中线性不可分
图1-2 空间中线性可
显然,经过这样一个简单的映射,原本在R*R空间线性不可分的两类在R*R*R空间变得线性可分。通过这个简单的例子,我们可以得出这样的启示:将数据从低维空间映射到高维空间,能够提供更好的分类能力,从而使许多在低维空间用线性方法难以解决的问题,在高维空间中可以用线性方法完成。这就是维数增长带给我们的好处,但它随之产生的问题便是计算复杂度的增大。随着高维空间维数的不断增长,求解分类面的代价会越来越大,甚至于无法求解,即产生“维数灾难”问题。那么如何才能有效利用维数增长带来的好处,而又能避免“维数灾难”呢?事实上,在多数情况下,我们并不需要明确知道映射到高维空间的点的坐标,而只需要它们之间的内积。核函数即为我们提供了一种有效的解决办法。
定义1.1(核函数)设 是从原始输入空间到某个高维空间F的非线性映射,如果对于任意的
,函数 都满足:
其中,<, >表示内积运算,则称函数 为核函数。
可见,利用核函数 k,我们不必知道映射Φ的具体形式,就可以在原始空间中高效地计算出高维空间中样本的内积。在目标识别应用中,常用的核函数就是高斯核函数:
(1-4)
综上所述,核方法的基本思想可以概括为:首先通过一个非线性映射将输入空间变换到某个高维(甚至无限维)空间,然后在这个高维空间中完成相应的线性运算,而这种非线性映射是通过定义适当的内积函数(即核函数)而实现的。粗略地说,任何一种线性算法,如果可以表示为只包含内积运算的形式,都可以用核函数代替内积,从而得到与之相对应的核方法。
本课题对以下五类线性算法及其相应的核方法进行研究:
(1)主成分分析(Principal ComponentAnalysis, PCA)/核主成分分析(Kernel PrincipalComponent Analysis, KPCA);
(2)近邻保持投影(Neighborhood PreservingProjection, NPP)/核近邻保持投影(Kernel NeighborhoodPreserving Projection, KNPP);
(3)局部保持投影(Local PreservingProjection, LPP)/核局部保持投影(Kernel Local PreservingProjection, KLPP);
(4)局部切空间排列(Local Tangent SpaceAlignment, LTSA)/核局部切空间排列(Kernel Local TangentSpace Alignment, KLTSA);
(5)线性鉴别局部切空间排列(Linear Discriminant LocalTangent Space Alignment, LDLTSA)/核鉴别局部切空间排列(Kernel Discriminant LocalTangent Space Alignment, KDLTSA)。
对于每种算法,详细描述其基本思想,总结其实现步骤,并对其计算复杂度进行评估。
1.2融合识别算法
融合识别一般可以在三个层次上进行:(原始)数据层、特征层和决策层。本课题主要对基于典型相关分析(CCA)算法的特征层融合方法和基于D-S证据理论的决策层融合方法进行研究。
1.3目标检测算法
目标检测是雷达目标识别的一个重要环节,针对本课题的研究内容,分别研究基于一维距离像的扩展目标检测算法和SAR图像目标检测算法。其中,基于一维距离像的扩展目标检测算法采用经典的二进制积累检测器。