【AI视野·今日Robot 机器人论文速览第五十三期】Thu, 12 Oct 2023

AI视野·今日CS.Robotics 机器人学论文速览Thu, 12 Oct 2023Totally 25 papers👉上期速览✈更多精彩请移步主页Daily Robotics PapersPixel State Value Network for Combined Prediction and Planning in Interactive EnvironmentsAuthors Sasch

hitrjj

368人浏览 · 2023-10-14 10:27:13

hitrjj · 2023-10-14 10:27:13 发布

AI视野·今日CS.Robotics 机器人学论文速览
Thu, 12 Oct 2023
Totally 25 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Pixel State Value Network for Combined Prediction and Planning in Interactive Environments
Authors Sascha Rosbach, Stefan M. Leupold, Simon Gro johann, Stefan Roth
在城市环境中运行的自动驾驶车辆必须与其他交通参与者可靠地交互。规划算法通常利用单独的预测模块来预测对象的概率、多模态和交互行为。将预测和规划设计为两个独立的模块会带来重大挑战，特别是由于这些模块的相互依赖性。这项工作提出了一种将预测和规划结合起来的深度学习方法。训练具有 U Net 架构的条件 GAN 来预测两个高分辨率图像序列。这些序列表示显式运动预测，主要用于训练上下文理解，以及适合规划编码运动可达性、物体动力学、安全性和驾驶舒适性的像素状态值。该模型可以利用现实世界的驾驶数据，在由基于采样的模型预测规划器渲染的目标图像上进行离线训练。

Automated Layout Design and Control of Robust Cooperative Grasped-Load Aerial Transportation Systems
Authors Carlo Bosio, Jerry Tang, Ting Hao Wang, Mark W. Mueller
我们使用最优控制理论和分层控制策略，提出了一种通过无人机团队进行协作空中运输的新颖方法。我们假设无人机通过刚性附件连接到有效载荷，本质上将整个系统转变为一个更大的飞行物体，在无人机的附件位置带有推力模块。我们研究了有效载荷周围推力模块的最佳布置，以便所得系统对干扰具有鲁棒性。我们选择数学 H 2 范数作为稳健性的衡量标准，并提出迭代优化例程来计算物体周围车辆的最佳布局。

AG-CVG: Coverage Planning with a Mobile Recharging UGV and an Energy-Constrained UAV
Authors Nare Karapetyan, Ahmad Bilal Asghar, Amisha Bhaskar, Guangyao Shi, Dinesh Manocha, Pratap Tokekar
在本文中，我们提出了一种针对能量受限的无人机和无人地面车辆 UGV 团队进行覆盖路径规划的方法。无人机和无人车都有必须覆盖的预定义区域。目标是两个机器人执行完整的覆盖，同时最小化覆盖时间。 UGV还可以充当移动充电站。无人机和无人地面车辆偶尔需要会合充电。我们提出了一种启发式方法来解决这个 NP 硬规划问题。我们的方法涉及最初确定覆盖路径，而不考虑能量限制。随后，我们对这些路径的片段进行聚类，并利用图匹配将无人机集群分配给 UGV 集群，以实现高效的充电管理。我们对现实世界的覆盖应用程序进行了数值分析，结果表明，与贪婪方法相比，我们的方法平均减少了 11.33 的交会开销。

ViT-A*: Legged Robot Path Planning using Vision Transformer A*
Authors Jianwei Liu, Shirui Lyu, Denis Hadjivelichkov, Valerio Modugno, Dimitrios Kanoulas
腿式机器人，特别是四足机器人，提供了有前景的导航能力，特别是在需要穿越不同地形和避障的场景中。本文解决了通过集成数据驱动的路径规划方法使腿式机器人能够有效地导航复杂环境的挑战。我们提出了一种利用可微分规划器的方法，允许通过神经网络学习端到端全局计划来指挥四足机器人。该方法利用 2D 地图和障碍物规格作为输入来生成全局路径。为了增强所开发的基于神经网络的路径规划器的功能，我们使用 Vision Transformers ViT 进行地图预处理，以有效处理更大的地图。

HealthWalk: Promoting Health and Mobility through Sensor-Based Rollator Walker Assistance
Authors Ivanna Kramer, Kevin Weirauch, Sabine Bauer, Mark Oliver Mints, Peer Neubert
助行车可以让身体有缺陷的人增加活动能力，让他们有信心和独立地更长时间地参与社会。然而，助行车使用者常常姿势不良，导致进一步的健康问题，最坏的情况是跌倒。将传感器集成到助行车设计中可以帮助解决这个问题，并形成一个允许其他几个有趣用例的平台。本文简要概述了现有系统以及该领域当前的研究方向和挑战。

Imitation Learning from Observation with Automatic Discount Scheduling
Authors Yuyang Liu, Weijun Dong, Yingdong Hu, Chuan Wen, Zhao Heng Yin, Chongjie Zhang, Yang Gao
人类经常通过观察和模仿来获得新技能。对于机器人代理来说，从互联网上提供的大量未标记视频演示数据中学习需要模仿专家而无法访问其动作，这提出了称为“从观察中模仿学习”的挑战 ILfO 。解决 ILfO 问题的常见方法是将其转换为逆强化学习问题，利用根据代理和专家的观察计算出的代理奖励。尽管如此，我们发现以进度依赖属性为特征的任务对这些任务中的此类方法提出了重大挑战，代理需要首先学习专家的先前行为，然后才能掌握后续行为。我们的调查表明，主要原因是分配给后续步骤的奖励信号阻碍了初始行为的学习。为了应对这一挑战，我们提出了一种新颖的 ILfO 框架，使智能体能够在进入后续行为之前掌握早期行为。我们引入了自动折扣调度 ADS 机制，该机制在训练阶段自适应地改变强化学习中的折扣因子，首先优先考虑早期奖励，只有在掌握了早期行为后才逐渐参与后期奖励。

RANS: Highly-Parallelised Simulator for Reinforcement Learning based Autonomous Navigating Spacecrafts
Authors Matteo El Hariry, Antoine Richard, Miguel Olivares Mendez
如今，真实的模拟环境对于验证和构建可靠的机器人解决方案至关重要。当使用基于强化学习 RL 的控制策略时尤其如此。为此，机器人和强化学习开发人员都需要工具和工作流程来创建物理上精确的模拟和合成数据集。 Gazebo、MuJoCo、Webots、Pybullets 或 Isaac Sym 是可用于模拟机器人系统的众多工具中的一些。由于问题的高度复杂性，开发基于学习的空间导航方法是一个密集的数据驱动过程，需要高度并行的模拟。当谈到航天器的控制时，没有专门为强化学习设计的易于使用的仿真库。我们通过利用 NVIDIA Isaac Gym 的功能来解决这一差距，其中物理模拟和策略训练都驻留在 GPU 上。在此工具的基础上，我们提供了一个开源库，使用户能够模拟数千个并行航天器，这些航天器学习一组机动任务，例如位置、姿态和速度控制。

Deep Kernel and Image Quality Estimators for Optimizing Robotic Ultrasound Controller using Bayesian Optimization
Authors Deepak Raina, SH Chandrashekhara, Richard Voyles, Juan Wachs, Subir Kumar Saha
超声波是一种常用的医学成像方式，需要超声波专家根据采集的图像手动操纵超声波探头。自主机器人超声波 RUS 是这种手动程序的一个有吸引力的替代方案，可以减少超声检查人员的工作量。 A RUS 的关键挑战是优化不同患者感兴趣区域的超声图像质量。这需要解剖学知识、误差源识别以及精确的探头位置、方向和压力。在优化与机器人探针控制器相关的这些参数时，样品效率非常重要。贝叶斯优化 BO 是一种高效优化框架示例，最近已被应用于优化探头的 2D 运动。然而，需要进一步改进以提高探针高维控制的样品效率。我们的目标是通过使用神经网络来学习 BO 中的低维内核（称为 Deep Kernel DK）来克服这个问题。 DK 的神经网络使用手术过程中获取的探针和图像数据进行训练。提出了两种图像质量估计器，它们使用深度卷积神经网络并向 BO 提供实时反馈。我们在三个膀胱模型上使用这两个反馈功能验证了我们的框架。对于机器人探针的 6D 控制，我们的样品效率提高了 50 多倍。

LESS-Map: Lightweight and Evolving Semantic Map in Parking Lots for Long-term Self-Localization
Authors Mingrui Liu, Xinyang Tang, Yeqiang Qian, Jiming Chen, Liang Li
精确且长期稳定的定位对于停车场的自动驾驶或自动代客泊车、短信等任务至关重要。现有方法依赖于固定且内存效率低下的映射，缺乏强大的数据关联方法。而且不适合精确定位或长期地图维护。在本文中，我们提出了一种基于地面语义特征、利用低成本相机的新型测绘、定位和地图更新系统。我们提出了一种精确且轻量级的参数化方法来建立改进的数据关联并实现厘米级的精确定位。此外，我们提出了一种新颖的地图更新方法，通过为参数化语义特征实现高质量的数据关联，允许在重新定位期间连续更新和细化地图，同时保持厘米级精度。我们在现实世界的实验中验证了所提出的方法的性能，并将其与最先进的算法进行比较。该方法在配准过程中平均精度提高了5cm。

Exploring Social Motion Latent Space and Human Awareness for Effective Robot Navigation in Crowded Environments
Authors Junaid Ahmed Ansari, Satyajit Tourani, Gourav Kumar, Brojeshwar Bhowmick
这项工作提出了一种通过学习从社交运动潜在空间生成机器人控制来进行社交机器人导航的新颖方法。通过利用这种社交运动潜在空间，所提出的方法在社交导航指标（例如成功率、导航时间和轨迹长度）方面实现了显着改进，同时产生更平滑、更少的急动和角度偏差以及更多的预期轨迹。通过与各种场景下的基线模型进行比较，证明了该方法的优越性。

CoPAL: Corrective Planning of Robot Actions with Large Language Models
Authors Frank Joublin, Antonello Ceravola, Pavel Smirnov, Felix Ocker, Joerg Deigmoeller, Anna Belardinelli, Chao Wang, Stephan Hasler, Daniel Tanneberg, Michael Gienger
在追求能够接管传统上由人类执行的任务的完全自主的机器人系统时，开放世界环境的复杂性提出了相当大的挑战。为了解决这一问题，本研究为应用于机器人任务和运动规划的大型语言模型法学硕士领域做出了贡献。我们提出了一种系统架构，可以协调多个认知级别之间的无缝相互作用，包括推理、规划和动作生成。其核心在于一种新颖的重新规划策略，可以处理生成的计划中的物理错误、逻辑错误和语义错误。

SAGE-ICP: Semantic Information-Assisted ICP
Authors Jiaming Cui, Jiming Chen, Liang Li
未知环境中稳健且准确的姿态估计是机器人应用的重要组成部分。我们专注于基于LiDAR的点对点ICP结合有效的语义信息。本文提出了一种新颖的语义信息辅助 ICP 方法，名为 SAGE ICP，该方法利用了里程计中的语义。整个扫描的语义信息由3D卷积网络及时有效地提取，这些逐点标签深入参与配准的每个部分，包括语义体素下采样、数据关联、自适应局部地图和动态车辆去除。与之前的语义辅助方法不同，即使语义信息存在一定误差，所提出的方法也可以提高大规模场景中的定位精度。

D2M2N: Decentralized Differentiable Memory-Enabled Mapping and Navigation for Multiple Robots
Authors Md Ishat E Rabban, Pratap Tokekar
最近，已经提出了许多用于多机器人导航的基于学习的模型。然而，这些模型缺乏记忆，仅依靠机器人当前的观察来计划其行动。他们无法利用过去的观察来规划更好的路径，尤其是在复杂的环境中。在这项工作中，我们提出了一种完全可微分且分散的内存支持架构，用于多机器人导航和绘图，称为 D2M2N。 D2M2N 维护环境的紧凑表示以记住过去的观察结果，并使用值迭代网络进行复杂的导航。

Pre-Trained Masked Image Model for Mobile Robot Navigation
Authors Vishnu Dutt Sharma, Anukriti Singh, Pratap Tokekar
二维自上而下地图通常用于移动机器人通过未知区域的导航和探索。通常，机器人使用机载传感器根据本地观察逐步构建导航地图。最近的研究表明，通过基于学习的方法预测环境中的结构模式可以极大地提高任务效率。虽然许多此类工作使用有限的数据集构建特定于任务的网络，但我们表明现有的基础视觉网络无需任何微调即可完成相同的任务。具体来说，我们使用在街道图像上预先训练的蒙版自动编码器，跨不同的输入模式呈现视野扩展、单智能体拓扑探索和室内测绘多智能体探索的新颖应用。我们的工作促进了将基础视觉模型用于广义结构预测驱动的应用，特别是在缺乏训练数据的情况下。

Efficient Path Planning in Large Unknown Environments with Switchable System Models for Automated Vehicles
Authors Oliver Schumann, Michael Buchholz, Klaus Dietmayer
随着配置空间大小的增加，大型环境对路径规划算法提出了挑战。此外，如果环境主要是未探索的，则规划的大量路径将穿过未知区域。因此，每当路径与新发现的障碍物碰撞时，就会对整个路径进行彻底的重新规划。我们提出了一种新颖的方法，可以在一定距离后停止路径规划算法。它用于在大型环境中导航算法，并且不易出现现有导航方法的问题。此外，我们开发了一种方法来检测重大环境变化，以便更有效地重新规划。最后，我们扩展了路径规划器以用于 U Shift 概念车。它可以切换到另一个系统模型并绕其后轴中心旋转。结果表明，与标准 Hybrid A 相比，所提出的方法生成几乎相同的路径，同时大大减少了执行时间。

Multi-Robot Cooperative Navigation in Crowds: A Game-Theoretic Learning-Based Model Predictive Control Approach
Authors Viet Anh Le, Vaishnav Tadiparthi, Behdad Chalaki, Hossein Nourkhiz Mahjoub, Jovin D sa, Ehsan Moradi Pari, Andreas A. Malikopoulos
在本文中，我们开发了一个控制框架，用于协调多个机器人在拥挤的环境中导航。我们的框架由每个机器人的本地模型预测控制 MPC 和预测行人轨迹的社交长期短期记忆模型组成。我们为每个单独的机器人制定了本地 MPC 公式，其中包括单独目标和共享目标，其中后者鼓励机器人之间出现协调。接下来，我们分别将多机器人导航和人类机器人交互视为潜在博弈和两人博弈，然后采用迭代最佳响应方法以集中式和分布式方式解决由此产生的优化问题。

Eclares: Energy-Aware Clarity-Driven Ergodic Search
Authors Kaleb Ben Naveed, Devansh Agrawal, Christopher Vermillion, Dimitra Panagou
在规划信息轨迹的同时考虑信息在环境中的空间分布，以及机器人有限的电池容量等约束，使得长时间持续覆盖问题变得复杂。遍历搜索方法在优化机器人轨迹时考虑环境信息的空间分布，然而，当前的方法缺乏为随空间和时间随机变化的环境构建目标信息空间分布的能力。此外，当前处理电池容量限制的覆盖方法要么假设简单的机器人和电池模型，要么计算成本昂贵。为了解决这些问题，我们提出了一个名为 Eclares 的框架，其中我们的贡献有两个。 1 首先，我们提出了一种使用清晰度（限制在 0,1 之间的信息度量）构建用于遍历轨迹优化的目标信息空间分布的方法。清晰度动态使我们能够捕获由于缺乏测量而导致的信息衰减，并量化随机时空环境中可获得的最大信息。 2 其次，我们没有直接跟踪遍历轨迹，而是引入了能量感知 eware 过滤器，它迭代验证遍历轨迹，以确保机器人在需要时有足够的能量返回充电站。所提出的 eware 滤波器适用于非线性机器人模型，并且计算量轻。

SAILing CAVs: Speed-Adaptive Infrastructure-Linked Connected and Automated Vehicles
Authors Matthew Nice, Matthew Bunting, George Gunter, William Barbour, Jonathan Sprinkle, Dan Work
这项工作展示了道路控制速度自适应、基础设施连接的互联和自动化车辆的新功能。我们开发并部署了一款经过轻微改造的车辆，该车辆能够动态调整车辆速度，以响应使用 LTE 连接的基础设施生成的发布的可变速度限制消息。这项工作描述了开源硬件和软件平台，该平台能够实现基于基础设施的可变速度限制与现有车辆平台之间的集成，以实现自动控制。该车辆部署在田纳西州纳什维尔 24 号州际公路早上交通拥堵的情况下。

Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization
Authors Fan Yang, Wenxuan Zhou, Zuxin Liu, Ding Zhao, David Held
安全强化学习 RL 在将 RL 算法应用于安全关键的现实应用程序、解决最大化奖励和遵守安全约束之间的权衡方面发挥着重要作用。这项工作引入了一种新颖的方法，将强化学习与轨迹优化相结合，以有效地管理这种权衡。我们的方法将安全约束嵌入到修改后的马尔可夫决策过程 MDP 的操作空间中。强化学习代理产生一系列动作，并通过轨迹优化器将其转化为安全轨迹，从而有效确保安全性并提高训练稳定性。这种新颖的方法在具有挑战性的 Safety Gym 任务中表现出色，在推理过程中实现了显着更高的奖励和接近零的安全违规。

Leader-Follower Formation Control of Perturbed Nonholonomic Agents along Parametric Curves with Directed Communication
Authors Bin Zhang, Hui Zhi, Jose Guadalupe Romero, David Navarro Alarcon
在本文中，我们提出了一种新的非完整智能体形成控制器，以形成一般参数曲线。首先，我们推导出开放曲线和封闭曲线的统一参数表示。然后，设计了引导跟随器形成控制器来形成参数曲线。我们在控制器设计中考虑定向通信和恒定输入干扰抑制。基于严格李亚普诺夫的稳定性分析证明了所提出的控制器的渐近稳定性。

FGPrompt: Fine-grained Goal Prompting for Image-goal Navigation
Authors Xinyu Sun, Peihao Chen, Jugang Fan, Thomas H. Li, Jian Chen, Mingkui Tan
对于自主系统来说，学习导航到图像指定的目标是一项重要但具有挑战性的任务。智能体需要推断出拍摄照片的目标位置。现有的方法试图通过学习导航策略来解决这个问题，该策略独立地捕获目标图像和观察图像的语义特征，最后将它们融合以预测一系列导航动作。然而，这些方法有两个主要限制。 1 他们可能会错过目标图像中的详细信息，从而无法推断出目标位置。 2 更关键的是，很难关注观察图像中与目标相关的区域，因为它们试图在没有目标调节的情况下理解观察。在本文中，我们旨在通过设计一种用于图像目标导航的细粒度目标提示 FGPrompt 方法来克服这些限制。特别是，我们利用目标图像中的细粒度和高分辨率特征图作为执行条件嵌入的提示，这保留了目标图像中的详细信息并引导观察编码器关注目标相关区域。与图像目标导航基准上的现有方法相比，我们的方法在 Gibson、MP3D 和 HM3D 3 个基准数据集上带来了显着的性能改进。特别是在 Gibson 上，我们仅用 1 50 个模型大小就将最先进的成功率提高了 8 倍。

DESTINE: Dynamic Goal Queries with Temporal Transductive Alignment for Trajectory Prediction
Authors Rezaul Karim, Soheil Mohamad Alizadeh Shabestary, Amir Rasouli
由于代理的未知特征及其不同的意图，在多代理设置中预测时间一致的道路使用者轨迹是一项具有挑战性的任务。除了使用语义图信息和建模交互之外，建立一种能够推理不同粒度级别的行为的有效机制也很重要。为此，我们提出了具有时间转换对齐目标方法的动态目标查询。与过去的技术不同，我们的方法 1 动态预测智能体目标，而不考虑特定的道路结构（例如车道），从而使该方法能够对目的地进行更准确的估计 2 通过以粗略到精细的方式生成未来轨迹来实现符合地图的预测，其中较低帧速率下的较粗略预测作为中间目标，3 使用一个注意力模块，旨在通过屏蔽注意力暂时对齐预测轨迹。

Optimizing the Placement of Roadside LiDARs for Autonomous Driving
Authors Wentao Jiang, Hao Xiang, Xinyu Cai, Runsheng Xu, Jiaqi Ma, Yikang Li, Gim Hee Lee, Si Liu
多智能体协同感知是自动驾驶领域日益热门的话题，其中路边激光雷达发挥着至关重要的作用。然而，如何优化路边激光雷达的放置是一个至关重要但经常被忽视的问题。本文提出了一种通过选择场景内的优化位置来优化路边激光雷达放置的方法，以获得更好的感知性能。为了有效地获得最佳位置组合，提出了一种基于感知增益的贪心算法，依次选择能够最大化感知增益的位置。我们将感知增益定义为放置新激光雷达时感知能力的增强。为了获得感知能力，我们提出了一种感知预测器，它学习仅使用单个点云帧来评估 LiDAR 的放置。

NEWTON: Are Large Language Models Capable of Physical Reasoning?
Authors Yi Ru Wang, Jiafei Duan, Dieter Fox, Siddhartha Srinivasa
大型语言模型法学硕士通过其情境化表示，已被经验证明可以封装句法、语义、词义和常识知识。然而，对他们的物理推理能力的探索有限，特别是在理解日常物体的关键属性方面。为了解决这一差距，我们引入了 NEWTON，这是一个用于评估法学硕士物理推理技能的存储库和基准。此外，为了实现该基准的特定领域适应，我们提供了一个管道，使研究人员能够生成该基准的变体，该变体已根据与其应用程序相关的对象和属性进行了定制。 NEWTON 存储库包含 2800 个对象属性对的集合，为生成无限规模评估模板提供了基础。 NEWTON 基准测试由 16 万个 QA 问题组成，这些问题使用 NEWTON 存储库来调查跨基础、显式和隐式推理任务的几种主流语言模型的物理推理能力。通过广泛的实证分析，我们的结果突出了法学硕士的物理推理能力。我们发现像 GPT 4 这样的 LLM 在基于场景的任务中表现出强大的推理能力，但与人类相比，在对象属性推理方面表现出较低的一致性 50 vs. 84 。此外，NEWTON 平台展示了其评估和增强语言模型的潜力，为将其集成到物理基础设置（例如机器人操作）中铺平了道路。

Leveraging Neural Radiance Fields for Uncertainty-Aware Visual Localization
Authors Le Chen, Weirong Chen, Rui Wang, Marc Pollefeys
作为一种有前途的视觉定位方式，场景坐标回归 SCR 在过去十年中取得了巨大的进步。最近的方法通常采用神经网络来学习从图像像素到 3D 场景坐标的映射，这需要大量带注释的训练数据。我们建议利用神经辐射场 NeRF 生成 SCR 训练样本。尽管 NeRF 的渲染效率很高，但许多渲染数据受到伪影污染或仅包含最小的信息增益，这可能会阻碍回归精度或因冗余数据带来不必要的计算成本。本文从三个方面解决了这些挑战 1 NeRF 旨在分别预测渲染的颜色和深度图像的不确定性，从而揭示像素级别的数据可靠性。 2 SCR被表述为具有认知不确定性的深度证据学习，用于评估信息增益和场景坐标质量。 3 基于不确定性的三种艺术，形成了一种新颖的视图选择策略，可显着提高数据效率。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com