与由冈田隆之教授领导的东北大学研究团队合作,Socionext Inc .开发了一种新方法,可以减少SLAM(同步定位和测绘)所需的处理时间,这对于执行自主控制的设备来说非常重要,时间仅为传统技术所需时间的1/60。这种新方法使得在一些CPU性能有限、功耗有限的边缘设备,如自动驾驶汽车、AGV (Automatic Guided Vehicle)、机器人、无人机等执行自主控制的设备,以及AR (Augmented Reality,增强现实)眼镜等设备的SoC中执行高级SLAM处理成为可能。
这项研究工作已被ICCV(计算机视觉领域最负盛名的会议之一)接受为演讲报告。这种新方法是在10月11日至17日在线举行的ICCV 2021会议上推出的。
根据获取物体周围三维信息的传感方法,SLAM可以分为两种主要类型。一种是激光雷达(Light Detection and Ranging),利用激光测量距离。另一个是Visual SLAM,它使用相机图像。视觉SLAM发展显著,因为使用的摄像头相对便宜,而且除了同时定位,这种方法还可以结合使用图像识别的各种控制过程,因此可以期待很多应用。
近年来,随着深度学习的引入,图像识别技术取得了显著进展,深度学习的应用成为视觉SLAM演进的重要因素。然而,基于特征点和摄像机方向的未知地标三维信息的波束调整优化是传统方法的瓶颈。对于CPU处理能力有限的边缘SoC设备,这将使实际处理变得困难。
为了应对这一挑战,研究团队提出了一种利用“图网络(GN)”[1](一种图神经网络)进行推理的近似计算方法。新方法包括从GN块输入的关键帧和地标信息中推断更新信息(图2),并通过多栈GN结构收敛到最终值(图3)。与传统的勒温伯格-马夸特方法的标准光束像差相比,这使得推理过程需要更少的计算量。
研究团队利用这种新的推理方法实现了Visual SLAM的绑定调整,并与广泛使用的方法“G2O”进行了对比[2]。PC仿真结果表明,与g2o相比,新方法可将处理时间缩短至1/60。(图4)
Socionext将从这项研究工作中积累经验,并将Visual SLAM技术确立为公司定制SoC解决方案的产品之一。该公司将为图像识别领域的客户系统(如工业设备和移动设备)提出创新的性能改进方案。此外,公司将继续研究和开发新的推理方法,以提高处理效率,并将其应用扩展到图像识别以外的新客户应用。
关于反社会公司
Socionext Inc .是一家全球创新型企业,业务涉及片上系统的设计、研发和销售。公司聚焦消费、汽车、工业领域的世界先进技术,在不断推动多元化应用发展的今天。Socionext融合了世界一流的专业知识、经验和丰富的IP产品组合,致力于为客户提供高效的解决方案和客户体验。公司成立于2015年,总部位于日本横滨,在日本、亚洲、美国和欧洲设有办事处,领导产品开发和销售。