相关结果发表在ExpertSystemswithApplications中。
近年来,深度学习理论推动了人工智能技术的快速发展。基于深度学习理论的目标检测技术在许多工业应用中也取得了成功。目前的研究侧重于提高目标检测的速度或准确性,并没有考虑到效率和准确性。如何实现快速准确的目标检测成为人工智能领域的重要挑战。
在这项研究中,研究人员发现基于深度学习的目标检测技术的主要缺陷之一在于深度网络结构的重复特征提取和融合,导致不必要的计算成本。
因此,他们提出了一种多输入单输出目标识别框架(MiSo),它有别于传统的多输入多输出模型,降低了模型复杂度和推理时间开销。
此外,在此框架下,研究人员基于早先提出的eRF检测理论,设计了三种新的学习机制来更准确、更高效地提取热点特征信息,分别是感受野调整机制、残差注意力自学习机制和eRF-基于动态平衡的采样策略。
“我们将它们命名为M2YOLOF,”领导团队的王宏强说,“它在一张特征图上检测物体,在小物体上表现良好。它与YOLOF(YouOnlyLookOne-levelFeature)一样快,但更准确。"
他们在标准数据集基准上进行了尝试,并以每秒29帧的速度达到了39.2的平均精度(AP)。它比现有最先进的TridenNet-R50高2.6AP。
该方法为目标检测的研究和工业应用提供了新的思路。 返回作文素材列表