自动驾驶汽车的激光雷达传感器通过发出红外光脉冲,并测量它们从物体上弹回的时间,传感器创造点云,建立汽车周围环境的3D快照,从而帮助车辆行驶。理解原始的点云数据十分困难,而且在机器学习时代到来之前,需要训练有素的工程师明确他们希望手动捕获的特征。据外媒报道,麻省理工学院计算机科学与AI实验室(CSAIL)研究人员最新发表了一系列论文,表示可以利用深度学习自动处理3D成像应用的点云。
(图片来源:麻省理工学院)
论文资深作者之一,麻省理工学院教授Justin Solomon表示,“目前,90%的计算机视觉和机器学习仅涉及2D图像。我们的工作旨在帮助更好地表现3D世界,且不仅限于自动驾驶应用,还包括所有需要理解3D形状的领域。”
以前,大多数方法在从数据中获取点云的模式方面都不是特别成功,而这些数据是从空间中的3D点中获取有用信息所必需的。在该团队的一篇论文中,研究人员展示了他们分析点云的方法EdgeConv,通过使用动态图卷积神经网络,能够对单个对象进行分类和分割。丰田研究所(Toyota Research Institute)的机器学习科学家Wadim Kehl表示,“该算法通过构建相邻点的图,可以捕捉层级模式,从而推断出多种类型的通用信息,可供多种下游任务使用。”
此外,该团队还研究了点云处理的其他方面。例如,大多数传感器在3D世界中移动时会改变视角,每次对同一物体重新进行扫描时,物体的位置可能与上次看到的不同。要将多个点云合并成一个详细的世界视图,需要对齐多个3D点,这一过程称为“配准”(registration)。论文作者之一Yue Wang博士表示,“配准能使我们将来自不同来源的3D数据整合到一个共同的坐标系统。否则,我们无法从这些方法中获取有意义的信息。”
Solomon和Wang的第二篇论文演示了一种新的配准算法,称为DCP(Deep Closest Point,深度最近点),能更好地找到点云的可识别模式、点和边缘,以便与其他点云对齐。这对于自动驾驶汽车确定其在环境中的位置(定位)尤为重要。
DCP的一个局限性是其假设可以看到整个形状,而不仅是一面。这意味着DCP不能对齐物体形状的部分视图(称为“部分到部分配准”)。因此,在第三篇论文中,研究人员提出了一种改进的算法,称为部分配准网络(PRNet)。
Solomon表示,现有的3D数据与2D图像和照片相比,往往相当混乱、无结构化。Solomon的团队试图在没有大量机器学习技术需要的受控环境下,从混乱的3D数据中获取有意义的信息。DCP和PRNet标明,点云处理的一个关键方面是情境。点云A与点云B对齐所需的几何特征可能不同于将其与点云C对齐所需的特性。例如,在部分配准时,一个点云的形状的一部分可能在其他点云上是不可见的,因此无法用于配准。
Wang表示,该团队的工具已被计算机视觉领域和其他领域的许多研究人员使用。接下来,研究人员希望将这些算法应用于真实世界数据,包括从自动驾驶汽车收集的数据。Wang还表示,他们还计划使用自我监督学习,探索训练其系统的潜力,从而最小化所需的人类注释。
来源:盖世汽车
作者:罗珊
本文地址:https://www.d1ev.com/news/jishu/101946
以上内容转载自盖世汽车,目的在于传播更多信息,如有侵仅请联系admin#d1ev.com(#替换成@)删除,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。