雷锋网AI科技评论按:ICRA全称为“IEEE International Conference on Robotics and Automation”(机器人与自动化会议),是机器人技术领域最有影响力的国际学术会议之一。ICRA 2017于5月29日至6月4日举行,雷锋网AI科技评论将从新加坡带来一线报道。该会议举办期间,雷锋网将围绕会议议程及获奖论文展开系列专题报道,敬请期待。
论文一:《Self-supervised Learning of Dense Visual Descriptors》
论文作者:Schmidt, Tanner; Newcombe, Richard; Fox, Dieter
作者主页:http://homes.cs.washington.edu/~tws10/
相关机构:华盛顿大学
论文摘要:
图像像素间对应关系的鲁棒性估计是机器人技术中一个重要的问题。它被应用于对象、环境和其它代理的跟踪、映射与识别任务中。对应评估(Correspondence estimation)长期以来都是属于手工特征工程的领域。但是,最近深度学习技术为从原始数据中学习特征的任务提供了强大的工具。不过深度学习的缺点就是需要大量的(通常需要带有标签)训练数据来支持训练学习过程。据雷锋网了解,该论文提出了一种学习密集图像对应任务(Dense image correspondences)的新方法,其中研究员们利用强大的3D生成模型来实现程序自动标记视频数据中的对应关系。论文中使用了对比损失来训练完全卷积神经网络,以生成视点和照明不变的特征。
作为一个概念证明,研究员收集了两个数据集:第一个数据集描绘了一个人在各种各样的环境当中,但是视频的主体始终是这个人的上身与头部;第二个则描绘了许多天内的同一间办公室,而不同时间内办公室物体摆放方式不同。据悉,该数据集专注于重新访问相同的对象和环境,并且论文也表明了,仅通过本地跟踪数据(Local tracking data)训练CNN,所学习到的视觉描述符能够分辨出无标签视频间的对应关系。
论文链接:https://ieeexplore.ieee.org/document/7762851/
论文二:《Probabilistic Articulated Real-Time Tracking for Robot Manipulation》
论文作者:Garcia Cifuentes, Cristina; Issac, Jan; Wüthrich, Manuel; Schaal, Stefan; Bohg, Jeannette
作者主页:http://am.is.tue.mpg.de/people/ccifuentes
相关机构:德国斯图加特的研究所
论文摘要:
据雷锋网(公众号:雷锋网)了解,该论文提出了一种概率滤波方法(Probabilistic filtering method),它将联合测量(Joint measurements)与深度图像(Depth images)融合,以产生相机框架中末端执行器姿态(End-effector pose)的准确且实时的估计。在组合使用框架与视觉对象跟踪的时候,这样做可以避免框架转换。另外本文中通过对联合测量中的偏差进行建模和校正,以及机器人模型中的不准确性(比如较差的外置相机校准)来提高精度。
该论文的研究员通过基于坐标粒子滤波器(Coordinate Particle Filter)的异步深度图像更新和联合测量的卡尔曼滤波器(Kalman filtering)的原则组合,使得算法在计算效率上更加高效。该论文还在一个自主构建的数据集上定量评估算法,该数据集采集自一个真实的机器人平台,并且通过运动捕捉系统标注了真实数据(Ground truth)。实验还表明了,即使在诸如快速运动(Fast motion)、显著和长期闭塞(Significant and long-term occlusions)以及时变偏差等(Time-varying biases)挑战性条件下,该算法也具有稳健性和准确性。另外,为了方便其它研究员进行定量比较,该论文作者还将数据集和算法代码开放了出来。
论文链接:https://arxiv.org/abs/1610.04871
论文三:《SE3-Nets: Learning Rigid Body Motion using Deep Neural Networks》
论文作者:Byravan, Arunkumar; Fox, Dieter
作者主页:http://homes.cs.washington.edu/~barun/
相关机构:华盛顿大学
论文摘要:
据雷锋网了解,该论文介绍了SE3-Nets算法,这是一个旨在从原始点云数据中建模和学习刚体运动的深度神经网络。据悉,SE3-Nets仅仅依靠伴随着动作向量的深度图像(Depth images)序列和点数据关联(Point wise data associations),就能学会分割受影响对象并且预测出它们由于所施加的外力而导致的运动。SE3-Nets并不是直接学习点流向量(Point wise flow vectors),而是预测场景中不同部分的SE(3)变换。
通过使用桌面场景的模拟深度数据和机器人操纵器,研究员们证明了,相比于传统的基于流的网络,SE3-Nets的结构使得它能够在对象运动预测的任务中产生更加一致的预测结果。另外研究员还进行了其它的实验,该额外的实验内容是,使用深度摄像机观察一个Baxter机器人在桌面上推动物体,并且实验表明SE3-Nets在真实数据中也能取得很好的效果。
论文链接:https://arxiv.org/abs/1606.02378
论文四:《A Comparative Analysis of Tightly-Coupled Monocular, Binocular, and Stereo VINS》
论文作者:Paul, Mrinal Kanti; Wu, Kejian; Hesch, Joel A.; Nerurkar, Esha; Stergios Roumeliotis
作者主页:http://www-users.cs.umn.edu/~paulx152/
相关机构:明尼苏达大学
论文摘要:
本论文提出了一种可应用于Square-root inverse领域的“滑动窗口双摄像机视觉辅助惯性导航系统(Sliding-window two-camera vision-aided inertial navigation system, VINS)”。据雷锋网了解,研究员们在两种情形下评估了该系统的系性能。这两种情形分别是在两个摄像机图像之间的特征匹配被处理和两个摄像机图像间的特征匹配没有任何立体约束(比如,立体图像与双目的比较)。
据悉,为了更好地分析实验结果,该论文还提出了从双目转换为立体图像时信息增益(Information gain)的理论分析方法。另外,论文中还评估了在单眼VINS上使用双摄像机(立体图像和双目)系统的优点。除此之外,论文也尝试量化了不同图像处理前端(Image-processing frontends)和估计器设计选择(Estimator design choices)对最终实现精度的影响。最后,论文还在各种场景和运动曲线下,全面评估了算法的处理需求(即要求在移动处理器上达到实时的效果),同时也提供了与其它算法的准确性比较。
论文链接:http://mars.cs.umn.edu/research/stereo_vins.php
Via ICRA 2017
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/85468.html