特征金字塔网络
图片金字塔特征能够提高目标检测器的性能,可见图(1.a)所示,但是由于内存的限制往往导致训练不可行,因此一般不采用这种特征抽取方法。深度卷积神经网络的发展,带来了抽取特征的高效性,不仅能够表示高阶语义信息,也能够应对图片规模的变化。因此,基于卷积神经网络的特征抽取是很自然的方法。图(1.c)中SSD网络是第一个利用卷积神经网络形成图片特征金字塔网络的模型,但是这种结的低层特征没有高层特征检测小对象能力高。为了构建高效的特征金字塔,文献[1]中训练了图(1.d)中的FPN网络架构,每个预测头不仅仅利用低阶语义信息,也利用了高阶语义信息。图(1.d)中自上而下的结构就是特征金字塔,且这种结构具有可以很容易扩展到实例分割领域的优势。

图1 特征金字塔
参考文献
[1] Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2117-2125.
版权: 本篇博文采用《CC BY-NC-ND 4.0》,转载必须注明作者和本文链接