阿里巴巴提出Auto-Context R-CNN算法,刷出Faster RCNN目标检测新高度
基于区域的CNN(R-CNN),在目标检测领域具有统治地位,在兴趣区域(RoI)上的操作比如RoIPooling和RoIAlign扮演了重要角色,但是它们只利用了兴趣区域内的信息,而兴趣区域附近的上下文信息显然是对目标检测有帮助的。在auto-context和multi-class object layout 工作的启发下,提出了一个通用的上下文挖掘的RoI操作——RoICtxMining,它可以很方便的集成进R-CNNs系列算法的框架,并可以端到端训练。
RoICtxMining是在RoIPooling or RoIAlign上的简单有效的双层扩展,以object-RoI为中心,在周围八个上下文邻域创建3*3层叠来挖掘上下文信息,在这8个上下文邻域中,挖掘出最具鉴别力的context-RoI和与其对应的RoIPooling/RoIAlign特征,将这些特征与object-RoI的特征串联起来,用于最终的预测。
提出的自动上下文R-CNN(Auto-Context R-CNN)对遮挡和小目标同样鲁棒,而且在没有添加对抗训练的情况下能够增强抵御对抗样本攻击的能力。
RoICtxMining操作示意图:
在Faster R-CNN框架下改进的Auto-Context R-CNN网络架构:
Auto-Context R-CNN目标检测示例,可以看到一些小目标和被遮挡的目标都被检测出来了:
PASCAL VOC 2007数据集上的检测结果:
PASCAL VOC 2012数据集上的检测结果:
COCO Val数据集上的检测结果:
在KITTI pedestrian 与 cyclist数据集上的检测结果:
从以上结果看出,所提出的RoICtxMining方法对Faster R-CNN目标检测的改进异常显著。
接来下,作者又研究了所提出模型对样本攻击的鲁棒性。
对抗攻击样本的结果:
不同的上下文建模方法面对攻击的检测结果:
期待作者能早日放出代码!
欢迎访问www.52cv.net,获取更多计算机视觉与机器学习技术信息。
长按关注本公众号: