AGV导航现状与趋势

2020-06-09 21:14 性质：转载作者：龙建睿来源：赵越

免责声明：无人系统网（www.youuvs.com)尊重合法版权，反对侵权盗版。（凡是我网所转载之文章，文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点，与本网无关。如有需要删除，敬请来电商榷！）

算法难度

激光SLAM由于其研究的成熟以及误差模型的相对简单，在算法上门槛更低，部分开源算法甚至已经被纳入了ROS系统成为了标配。而反观视觉SLAM，首先图像处理本身就是一门很深的学问，而基于非线性优化的地图构建上也是非常复杂和耗时的计算问题。现在已经有许多优秀的开源算法(如ORB-SLAM[2]、LSD-SLAM[3])，但在实际环境中优化和改进现有的视觉SLAM框架，比如加入光照模型、使用深度学习提取的特征点、以及使用单双目及多目融合视角等技术，将是视觉SLAM进一步提升性能和实用性的必由之路。这些技术的算法门槛也远远高于激光SLAM。

计算需求

毫无疑问，激光SLAM的计算性能需求大大低于视觉SLAM。主流的激光SLAM可以在普通ARM CPU上实时运行，而视觉SLAM基本都需要较为强劲的准桌面级CPU或者GPU支持。但业界也看到了这其中蕴藏的巨大机会，为视觉处理定制的ASICS市场已经蠢蠢欲动。一个很好的例子是Intel旗下的Movidius，他们设计了一种特殊的架构来进行图像、视频与深度神经网络的处理，在瓦级的超低功耗下达到桌面级GPU才拥有的吞吐量。DJI的精灵4系列产品就是使用这类专用芯片，实现了高速低功耗的视觉计算，为无人机避障和近地面场景导航提供根据。

多机协作

视觉主要是被动探测，不存在多机器人干扰问题。而激光雷达主动发射，在较多机器人时可能产生干扰。尤其是固态激光雷达的大量使用，可能使得场景中充满了信号污染，从而影响激光SLAM的效果。

未来趋势

激光SLAM和视觉SLAM各擅胜场，单独使用都有其局限性，而融合使用则可能具有巨大的取长补短的潜力。例如，视觉在纹理丰富的动态环境中稳定工作，并能为激光SLAM提供非常准确的点云匹配，而激光雷达提供的精确方向和距离信息在正确匹配的点云上会发挥更大的威力(图4)。而在光照严重不足或纹理缺失的环境中，激光SLAM的定位工作使得视觉可以借助不多的信息进行场景记录。

图4，KITTI数据集视觉里程计。ORB-SLAM[2]，双目视觉。

V-LOAM[4]，视觉引导激光修正。

现实中的激光与视觉SLAM系统几乎都会配备惯性元件、轮机里程计、卫星定位系统、室内基站定位系统等辅助定位工具，而近年来SLAM系统与其他传感器的融合成为了一大热点。不同于以往基于卡尔曼滤波的松耦合融合方法，现在学界的热点是基于非线性优化的紧耦合融合。例如与IMU的融合和实时相互标定，使得激光或视觉模块在机动 (猛烈加减速和旋转) 时可以保持一定的定位精度，防止跟踪丢失，极大的提高定位与地图构建的稳定性。

激光点云信息本身也仍有潜力可挖。在高端的远距离多线激光雷达上，返回的点云除了包含方向和距离信息，还可以加入目标点的反射率信息。当线数较多较密时，由反射率信息构成的数据可以视为一种纹理信息，因此可以在一定程度上享受视觉算法和纹理信息带来的重定位等方面的优势。这些信息一旦融入到高精度地图中，高精度地图就可以在点云纹理两种形式间无缝切换，使得利用高精度地图的定位可以被只拥有廉价摄像头的自动驾驶汽车分享。这也是目前国外一些团队的研究方向([5])。

同时，视觉所依赖的投影模型，蕴含着非常丰富的“混搭”玩法。长、短基线的单双目结合，可以在保证大尺度定位水平的同时提高中近距离的障碍探测和地图构建精度；广角鱼眼和360度全向摄像头与标准单双目的结合，使得VSLAM的覆盖范围可以进一步提升，特别适合对场景按照距离的远近进行不同精度不同速度的定位。被动视觉与深度相机的结合，催生了RGB-D SLAM，而深度相机量程的逐步扩大，将给这种特殊VSLAM带来更大的应用空间。

VSLAM的另一个也许更宏大的扩展在AI端。端到端的深度学习所带来的图像特征，已经在识别和分类领域大大超越了人类手工选择的SIFT/SURF/ORB等特征。我们可以很安全的说，未来在低纹理、低光照等环境下，深度学习所训练出的提取、匹配和定位估算等方法，也一定会超越目前VSLAM领域最先进的手工方法。更不用说，图像本身所大量携带的信息，可以广泛用于场景理解、场景分类、物体识别、行为预测等重要方面。一个很可能的情况是，未来视觉处理系统将直接包含定位、地图构建、运动规划、场景理解以及交互等多个功能模块，更紧密的联合带来更加智能的机器人行动能力。

如果想深入了解SLAM技术的过去、现在和未来趋势，我们推荐文献[6]。

结语

SLAM技术将赋予为机器人和智能体前所未有的行动能力。作为当前SLAM框架的主要类型，激光SLAM与视觉SLAM必将在相互竞争和融合中发展，必将带来机器人技术和人工智能技术的真正革命，也将使得机器人从实验室和展示厅中走出来，真正服务和解放人类。

引用参考：

[1] Cartographer https://github.com/googlecartographer

[2] ORB-SLAM2 R. Mur-Artal and J. D. Tardos, “ORB-SLAM2: An open-source SLAM system for monocular, stereo, and RGB-D cameras,” IEEE Transactions on Robotics (2017).

[3] LSD-SLAM J. Engel, J. Stuckler, and D. Cremers, “Large-scale direct SLAM with stereo cameras,” Intelligent Robots and Systems (IROS), 2015 IEEE/RSJ International Conference on. IEEE, 2015

[4] V-LOAM J. Zhang and S. Singh, “Visual-lidar odometry and mapping: Low-drift, robust, and fast,” Robotics and Automation (ICRA), 2015 IEEE International Conference on. IEEE, 2015.

[5] G. Pascoe, W. Maddern, and P. Newman, “Direct visual localization and calibration for road vehicles in changing city environments,” Proceedings of the IEEE International Conference on Computer Vision Workshops, 2015.

[6] C. Cadena, et. al. “Past, present, and future of simultaneous localization and mapping: Toward the robust-perception age,” IEEE Transactions on Robotics 32.6 (2016): 1309-1332.