PSPNet

发现其实看的论文也不少了,但是有点不善于总结。经常性看过就忘掉了,以后得常看常总结了。

用MMsegmentation跑了一下这个模型,学习记录一下。

网络结构

PSPNet的核心思想是金字塔平均池化来捕捉不同尺度的上下文信息。

从©部分可以看出论文的主要工作。池化之后经过上采样恢复图像。

从(a)到©的backbone使用Resnet,并加入了空洞卷积

金字塔池化

PSPNet的核心部分是金字塔池化模块,用于捕捉不同尺度上的上下文信息。该模块首先对主干网络提取的特征图进行多个不同尺度的池化操作,以获取不同感受野的信息。常见的池化操作包括平均池化或最大池化。每个池化操作产生一个固定大小的特征图。

融合和上采样

将经过池化操作得到的特征图进行级联或逐元素相加的方式进行融合。这样可以将不同尺度上的上下文信息整合到一个特征图中。为了将融合后的特征图恢复到原始图像的尺寸,使用反卷积或插值等技术进行上采样操作。这样可以将低分辨率的特征图映射回输入图像的分辨率,得到像素级别的分割结果。