Faster R-CNN中的区域提议网络(RPN)如何工作?
1 484
1
该提问暂无详细描述
收藏
2021-01-25 22:21 更新 正直的烤面包 •  2520
共 1 个回答
高赞 时间
0

第一步 输入图像经过一个卷积网络,该网络将在最后一个卷积层上输出一组卷积特征图:

第二步 这些特征图在空间上进行滑动窗口,滑动窗口的大小为n×n(此处为3×3)。对于每个滑动窗口,将生成一个9个锚点的组,它们全部具有相同的中心(xa,ya),但具有3个不同的纵横比和3个不同的比例,如下所示。注意,所有这些坐标都是相对于原始图像计算的。

另外,对于这些锚点中的每个点,计算值p *,该值指示这些锚点与地面真相边界框有多少重叠。

IoU是联合交集,定义如下:

第三步 将从这些卷积特征图(如上红色框所示)中提取的3×3空间特征馈送到一个较小的网络,该网络具有两个任务:分类(cls)和回归(reg)。

回归器的输出确定预测的边界框(x,y,w,h),分类子网的输出是概率p,指示预测的框是否包含对象(1)或来自背景(0表示没有对象)。

损失函数由两个子网的输出定义,具有2项和一个平衡因子λ。

转载https://www.quora.com/How-does-the-region-proposal-network-RPN-in-Faster-R-CNN-work?q=R-CNN

收藏
2021-01-25 22:30 更新 阿托 •  8799