On visual slam

技术博客

相关人物

公共数据集

CVPR

  • 2004 CVPR Visual Odometry for Ground Vehicle Applications
    • David Nister, Oleg Naroditsky, and James Bergen
    • http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.91.5767&rep=rep1&type=pdf
    • 从3D Vision的视角出发设计的一个SLAM方案,整个方案设计的比较简单,只是着重连续较少帧的相对camera pose的估计,并没有完整的地图维护机制,因此容易造成drift。不过其3D Vision的算法和思想是后续很多的SLAM算法中都使用到的.
    • 基本思想:1)特征点匹配(harris+patch correlation) ; 2)相对姿态估计(五点法); 3)三维空间点估计(三角形法); 4)其它帧的pose估计(P3P法); 4)三维点优化(BA); 2D correspondence -> essential matrix -> pose -> triangulation -> 3D to 2D correspondence -> P3P -> optimization.

ECCV

    • 基本思想:不是基于特征点提取完成的相机定位,而是直接根据图像,深度和相机姿态进行的迭代优化策略;Ros上的代码,貌似不错;dense指的是尽量多的利用image信息,direct是相对应于feature matching/projection的direct image alignment方法(通常feature-based methods是最小化reprojection error,而direct image alignment methods中是最小化photometric error)。
    • 更dense的tracking和mapping会大幅度提高SLAM的精度和鲁棒性。直觉上想想,如果整幅图像的信息都可以拿来用,的确信息量会比提一些feature多很多。

ICCV

ICRA

Other

总结

  • Visual Slam大概分为:1)基于Keyframe 特征匹配;2)基于Kalman滤波估计的;
  • 基于Keyframe特征匹配方法分为:1)基于稀疏特征提取和匹配;2)基于稠密直接投影;
  • 基于稀疏特征的方法,经典之作是Nister Vo(2004CVPR); PTAM(2007ISMAR)贡献在于实现了tracking和mapping两个线程;ORB-SLAM (2015TOR)从各个模块进行优化和鲁棒性,并增加了loop closure线程;
  • 混合特征匹配和稠密直接的方法:semi-dense VO(2013ICCV),semi-direct VO(2014ICRA)
  • 数据源:单目视觉,双目视觉,多目视觉,RGBD,激光点云和IMU。