SSR-NET
[链接] 2020 高光谱&多光谱
主要分为三个部分:
- Cross-Mode Message Inserting
CMMI的主要目的是产生一个超多光谱的图像,融合公式如下,Y(HR-MSI),X(LR-HSI)。
$Z_{pre}(k)=\left\{ \begin{aligned} Y(k)&,~if ~ k \in \{s_1,\dots,s_l\} \\ X(k)&\uparrow,~otherwise\end{aligned} \right.$
然后再通过一个卷积块
$Z_{pre}=ReLU(Conv_{pre}(Z_pre))$
- Spatial Reconstruction Network
$Z_{spat}=Z_{pre} + Conv_{spat}(Z_{pre})$
这里为了让SpatRN更关注空间信息,作者提出了spatial edge loss。该loss实际上是对图像在x方向和y方向的一阶导进行监督。(可能是GDL Loss的变形)
- Spectral Reconstruction Network
$Z_{spec} = Z_{spat} + Conv_{spec}(Z_{spec})$
同样,为了让模型关注谱的恢复,作者提出了spectral edge loss。该loss实际上是对图像在谱方向对的一阶导进行监督。
最后模型的损失由三部分组成,spatial edge loss,spectral edge loss和fusion loss。
HAM-MFN
[链接] 2020 高光谱&多光谱
HAM-MFN网络主要由三个核心模块组成,CBR layer,Pixel Shuffle和Fusion Layer。
其中CBR Layer是借鉴了Inception的结构,并增加了残差连接用以增强特征提取。
Pixel Shuffle则是一种上采样操作,通过将输入$A \in R^{H\times W \times Cr^2}$进行reshape操作,得到新的特征图$B \in R^{rH \times rW \times C}$。其中r作为上采样因子超参,是可以人为进行调节的。
Fusion Layer则是将两个分支的特征图进行融合时采用的操作。
在示意图中,作者是对输入的HSI图像的尺寸(h,w)和MSI图像的尺寸(H,W)进行了假设,(H,W)=4(h,w)。
并且作者还提出了一种loss的计算方法RAP(RMSE+angle loss+Lap)
$L = RMSE + \lambda_1L_{angle}+\lambda_2L_{Lap}$
MHF-Net
[链接] 2020 高光谱&多光谱
作者首先引入了一组定理建立多光谱图像与GT的关系:
(1)对于高分辨率高光谱的图像(Ground Truth)$X$ 和高分辨率的多光谱图像$\tilde{Y}$之间存在如下关系:
$\tilde{Y} = XR$
(2)这一步不是很能理解,如果使用$\tilde{Y}$表示$X$的话,则需要引入一个残差量$\hat{Y}$:
$X = \tilde{Y}A + \hat{Y}B$
(3)而理论上的高分辨率的多光谱图像$\tilde{Y}$与实际的样本$Y$是存在差异的,这些差异是图像采集过程中的噪声$N_y$带来的:
$\tilde{Y} = Y - N_y$
最终对$X$进行表示:
$X=YA+\hat{Y}B+N_x,~N_x=-N_yA$
然后作者又引入一组定理将高光谱图像引入上述关系中来,建立一个GT和LR-HSI、HR-MSI之间的关系:
(4)对于高分辨率高光谱的图像(Ground Truth)$X$ 和低分辨率的高光谱图像$\tilde{Z}$之间存在如下关系:
$\tilde{Z} = CX$
(5)基于上述第(2)步:
$\tilde{Z}=C(\tilde{Y}A+\hat{Y}B)$
(6)在引入噪声量,实际训练样本$Z$:
$Z=C(YA+\hat{Y}B)+N,~ N=N_z-CN_yA$
这样就以重建HR-HSI为渠道,建立了LR-HSI样本$Z$和HR-MSI样本$Y$之间的关系。
最终作者设计了式(9)这样的一个损失,其中$f()$为正则项,并不使用先验知识来设计,而是通过网络学习得到。
式(9)中仅仅$\hat{Y}$为变量,因此作者设计了一个迭代式(10)用于优化$\hat{Y}$。
从(10)~(13)并不是很懂,但是作者最终得到一个迭代优化的式子(13)(14)。
将(14)式展开成如下几个操作,并通过DL模型进行表达
最后在模型的设计上,遵循上述的设计,如下图所示:
由图(a)可见,这个网络在训练中,一组样本,需要进行k次迭代训练,每次迭代都遵循式(14)的设计。
在训练Loss的设计上,使用最终输出图像$\hat{X}$和GT$X$的L2、每次迭代输出图像$X^{(k)}$和GT$X$的L2以及每次迭代过程中生成的高光谱图像的误差$\varepsilon^{(k)}$这三项之和共同作为Loss。
MSDCNN
[链接] 2018 彩色图像和多光谱图像
Muti-scale Muti-depth CNN
总体来看,MSDCNN体现了一个多尺度,双分支的设计,并且引入了残差连接。在Deep分支,使用三种不同的卷积核融合图像,
RSIFNN
[链接] 2018 彩色图像&多光谱
本文是将PAN图像和MSI进行融合。
不同于直接将PAN图像作为MSI的一个通道直接覆盖在其上,然后进行处理的这种做法。本文设计了一个双分支的结构,分别处理PAN和MSI两种图像 。