我正在尝试撰写有关语义分割的论文,但对如何对分割网络生成的预测图进行升采样以匹配输入图像大小感到困惑。

例如,我使用Resnet101的变体作为细分网络(如本文所用)。通过这种网络结构,大小为321x321(在本文中再次使用)的输入会生成大小为41x41xC(C是类别数)的最终预测图。由于必须进行像素级的预测,因此需要将其上采样到321x321xC。 Pytorch提供向上采样功能,输出大小是预测图大小的倍数。因此,我不能在这里直接使用该方法。

因为此步骤涉及每个语义分段网络,所以我确信应该有一种标准的方法来实现这一点。

我将不胜感激任何指针。提前致谢。

最佳答案

也许您可以尝试的最简单的方法是:

  • 上采样8次。然后您将41x41输入变成328x328
  • 执行中心裁切以获得所需的形状321x321(例如,类似以下输入[3:,3:,:-4,:-4]的输入)
  • 08-25 05:46