【AI视野·今日Robot 机器人论文速览第二十期】Thu, 8 Jul 2021

AI视野·今日CS.Robotics 机器人学论文速览Thu, 8 Jul 2021Totally 19 papers????上期速览✈更多精彩请移步主页Daily Robotics PapersRRL: Resnet as representation for Reinforcement LearningAuthors Rutav Shah, Vikash Kumar通过直接的环境中直接交互自主

hitrjj

310人浏览 · 2021-07-11 12:01:39

hitrjj · 2021-07-11 12:01:39 发布

AI视野·今日CS.Robotics 机器人学论文速览
Thu, 8 Jul 2021
Totally 19 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

RRL: Resnet as representation for Reinforcement Learning
Authors Rutav Shah, Vikash Kumar
通过直接的环境中直接交互自主学习行为的能力可以导致能够提高生产力或在非结构化设置中提供护理的通用机器人。这种无限量的设置仅使用机器人的Probrioceptive传感器，例如车载相机，联合编码器等，这可能是由于高维度和部分可观察性问题而挑战政策学习。我们将RRL RESNET提出了钢筋的代表，用于加强一种直接的但有效的方法，可以直接从丙虫精神投入学习复杂的行为。 RRL熔断器功能从预训练的RESET中提取到标准强化学习管道中，并直接从国家直接提供与学习相当的结果。在模拟的Dexterous操纵基准测试中，在最先进的方法未能取得重大进展情况下，RRL提供了富裕的行为。 RRL的上诉在于，从代表学习，仿制学习和加强学习的领域汇集了简单。其在直接从视觉输入中学习行为的有效性和样本效率与直接从状态的匹配学习，即使在复杂的高维域中也远未显而易见。

On the Robot Assisted Movement in Wireless Mobile Sensor Networks
Authors Sajal K. Das, Rafa Kapelko
本文根据常规随机过程和平面上最初随机部署在线上的随机传感器，根据两个独立的一般随机过程。具有承载能力k的移动机器人放置在原点点处是移动传感器以实现诸如覆盖，连接等的一般调度要求，从而满足网络中的期望的通信属性。我们研究机器人运动中的能量消耗之间的权衡，传感器N，传感器范围R，干扰距离S和机器人容量k的数量，直到与干扰调度任务同时完成覆盖。在这项工作中，我们获得了机器人运动中的能量消耗的上限，并获得了机器人总运动成本的急剧下降，以便与干扰要求同时提供覆盖范围。

Learning Time-Invariant Reward Functions through Model-Based Inverse Reinforcement Learning
Authors Todor Davchev, Sarah Bechtle, Subramanian Ramamoorthy, Franziska Meier
逆钢筋学习是一种通过学习普通奖励功能的目标，从演示的行为进行了激励。然而，学习成本的普遍性概念通常仅在鲁棒性方面对各种空间扰动进行了评估，假设以固定的执行速度部署。然而，在机器人学的背景下，这在机器人的背景下是不切实际的，并且建筑时间不变解决方案至关重要。在这项工作中，我们提出了一种制定，使我们能够通过学习时间不变成本来改变执行的时间长度，并且2放松了从演示学习的时间对准要求。我们将我们的方法应用于两种不同类型的成本制剂，并在学习奖励函数的背景下评估其模拟放置和钉在孔任务中的表现。我们的结果表明，我们的方法使得从未对齐的演示中学习暂时不变的奖励，这也可以在空间上概括到超出分发任务。

Humans as Path-Finders for Safe Navigation
Authors Alessandro Antonucci, Paolo Bevilacqua, Stefano Leonardi, Luigi Palopoli, Daniele Fontanelli
在非结构化和人口流利的工作环境中广泛使用移动机器人的最重要障碍是计划安全路径的能力。在本文中，我们建议将此活动委托给一个人类运营商，在机器人标记的机器人面前，他的脚步会遵循遵循的路径。这种方法的实施需要高度的鲁棒性，在找到领导者遵循的特定人员时。我们提出了三相方法来实现这一目标1.识别和跟踪图像空间中的人，2.相机数据和激光传感器之间的传感器融合，3.与连续曲率曲线的点插值。本文描述了该方法，并以实验结果广泛验证。

Maintaining a Reliable World Model using Action-aware Perceptual Anchoring
Authors Ying Siu Liang, Dongkyu Choi, Kenneth Kwok
可靠的感知对于与世界互动的机器人至关重要。但是单独的传感器通常不足以提供这种能力，并且由于环境中的各种条件，它们易于错误。此外，即使物体远离视图并且不再可见，机器人也需要维持其周围环境的模型。这需要将感知信息锚定到表示环境中对象的符号。在本文中，我们提出了一种动作意识的感知锚定的模型，其使机器人能够以持久的方式跟踪对象。我们的规则的方法考虑了归纳偏差，以对低级对象检测的结果执行高级推理，并且它可以提高复杂任务的机器人的感知能力。我们对现有基线模型进行评估为对象永久性的现有基线模型，并显示使用1,371个视频的数据集在窃听本地化任务上表现出这些模型。我们还将我们的动作意识的感知锚定纳入认知架构的上下文中，并在通用机器人上展示其在现实变速箱组件任务中的益处。

WaspL: Design of a Reconfigurable Logistic Robot for Hospital Settings
Authors Yuyao Shi, Aamir Abdullah Hayat, Sivanantham Vinu, Mohan Rajesh Elara
医疗保健造成不同的逻辑需求，导致在医院环境中部署了几种设计的机器人。每个机器人都以其形式的形式带来了架空，即无限的缩放，专用充电站，编程接口，封闭式架构，培训要求等。本文报告了开发名为WASPL的可重构后勤机器人。 WASPL迎合了高移动性，开放机器人操作系统架构，多功能度和再溶解性特征的要求。它满足多种物流模式，如牵引，提升繁重的有效载荷，叉活低地面清关物，两个WASPL等嵌套，符合医院设置所需的不同应用程序。详细讨论了设计要求，机械布局和系统架构。与支持WASPL设计能力的实验结果一起呈现了基于其他标准机器人的有限元建模，基于其他标准机器人的比较。

Real-time Semantic 3D Dense Occupancy Mapping with Efficient Free Space Representations
Authors Yuanxin Zhong, Huei Peng
本文提出了一个实时语义3D占用映射框架。映射框架基于文献中的贝叶斯核推理策略。提出了两种新颖的免费空间表示，以有效地构建培训数据并提高映射速度，这是真实世界部署的主要瓶颈。即使在消费者级CPU上，我们的方法也可以实现实时映射。另一个重要的好处是，由于所提出的算法的覆盖完整性，我们的方法可以处理动态方案。提供了真实世界点云扫描数据集的实验。

RoboCup@Home Education 2020 Best Performance: RoboBreizh, a modular approach
Authors Antoine Dizet, C dric Le Bono, Am lie Legeleux, Ma lic neau, C dric Buche
每年，Robocup家庭竞争挑战团队和机器人能力。 2020年，Robocup家庭教育挑战在线组织，改变了通常的竞争规则。在本文中，我们提出了引领Robobreizh团队赢得比赛的最新发展。这些发展包括彼此连接的多个模块，允许辣椒机器人理解，行动和适应本地环境。最新的可用技术已被用于导航和对话。第一贡献包括组合对象检测和姿势估计技术来检测用户的意图。第二款贡献涉及通过演示使用学习，以容易地学习改善Pepper机器人技能的新运动。该提案赢得了2020年Robocup家庭教育挑战的最佳绩效奖。

RAM-VO: Less is more in Visual Odometry
Authors Iury Cleveston, Esther L. Colombini
能够在没有人为监督的情况下进行建筑车辆需要确定代理人的姿势。视觉内径算法VO算法使用仅从输入图像的视觉变化估计eGomotion。最新的VO方法利用卷积神经网络CNN广泛实现深度学习技术，在处理高分辨率图像时增加了大量成本。此外，在VO任务中，更多的输入数据并不意味着相反的更好预测，架构可以过滤掉无用的信息。因此，实现了计算效率和轻量级架构至关重要。在这项工作中，我们提出了RAM VO，该延伸了用于视觉测量任务的复发性注意力模型RAM。 RAM VO提高了信息的视觉和时间表示，并实现了近端策略优化PPO算法，以了解强大的策略。结果表明，使用大约300万个参数，RAM VO可以用六个自由度进行六个自由度。此外，Kitti DataSet上的实验表明RAM VO仅使用5.7可用的可视信息实现竞争结果。

Quadruped Locomotion on Non-Rigid Terrain using Reinforcement Learning
Authors Taehei Kim, Sung Hee Lee
有脚机器人需要能够走在不同的地形条件下。在本文中，我们为非刚性动态地形的学习机器提供了一种新的加强学习框架。具体而言，我们的框架可以在扁平弹性地形上产生四足动偶，该地形由由机器人的脚推动时被动上下移动的瓷砖矩阵。一个训练有素的机器人，55厘米的基础长度可以走在可沉入5厘米的地形上。我们提出了一系列的观察和奖励术语，使得我们发现将终效应历史和最终效应速度术语包括在观察中至关重要。我们通过培训具有各种地形条件的机器人来展示方法的有效性。

Learning Latent Actions to Control Assistive Robots
Authors Dylan P. Losey, Hong Jun Jeon, Mengxi Li, Krishnan Srinivasan, Ajay Mandlekar, Animesh Garg, Jeannette Bohg, Dorsa Sadigh
辅助机器人武器使残疾人能够自己进行日常任务。这些手臂是灵巧的，高维度，人们必须用来控制其机器人的界面是低维的。考虑用2 DOF操纵杆进行外包一个7 DOF机器人手臂。机器人正在帮助您吃晚餐，目前你想剪一块豆腐。今天的机器人假设操纵杆输入和机器人动作之间的预定映射在一个模式下操纵杆控制在x y平面中的机器人运动，在另一个模式中，操纵杆控制机器人的z偏航运动，等等。但这种映射在您尝试理想地执行的任务中错过了，一个操纵杆轴应控制机器人如何刺伤豆腐，另一个轴应控制不同的切割运动。我们的洞察力是，通过将机器人的高维动作嵌入低维和人类可控的潜在动作，我们可以实现直观，用户友好控制辅助机器人。我们将此过程划分为三个部分。首先，我们探索从脱机任务演示中学习潜在行动的模型，并正式确定潜在行动应满足的属性。接下来，我们将学习的潜在行动与自主机器人帮助相结合，以帮助用户达到并保持其高级目标。最后，我们学习操纵杆输入和潜在动作之间的个性化对准模型。我们在四个用户学习中评估了我们所产生的方法，非残疾参与者到达棉花糖，煮苹果馅饼，切割豆腐和组装甜点。然后，我们用每天利用辅助设备的两名残疾人测试我们的方法。

SiMPLeR: A Series-Elastic Manipulator with Passive Variable Stiffness for Legged Robots
Authors Sajiv Shah, Brad Saund
我们为具有可控刚度的系列弹性致动器提出了一种机械简单廉价的设计。对于运行，跳跃，投掷和操纵，然而，在机器人中，这些特征是用于跑步，跳跃，投掷和操纵，可变刚度致动器通过反馈控制器在低带宽处复杂或模仿。需要一种强大而简单的设计来构建具有动物能力的可靠和廉价的机器人。我们设计的关键洞察力是将扭转弹簧附加到定时皮带，以创建一个可变刚度线性弹簧。在拮抗一对中，改变电动机和关节之间的距离，然后改变致动器刚度。我们构建了我们提出的执行器的原型，显示了理论行为与实验表征相匹配，并展示了机器人一腿跳跃的应用。

Toward Robotically Automated Femoral Vascular Access
Authors Nico Zevallos, Evan Harber, Abhimanyu, Kirtan Patel, Yizhu Gu, Kenny Sladick, Francis Guyette, Leonard Weiss, Michael R. Pinsky, Hernando Gomez, John Galeotti, Howie Choset
高级复苏技术，如额外的额外的重新膜氧合Ecmo插管或复苏血管内球囊闭塞，即使是技术人员，也甚至在技术上困难。本文介绍了包括能够授予股血管进入的洞穴化系统的核心技术，这是这些程序的重要步骤和其在该领域更广泛使用的主要路障。这些技术包括运动机械手，各种传感方式和用户界面。此外，我们还评估我们的系统在外科幻影以及体内猪实验中。据我们所知，这导致了第一机器人辅助动脉导管辅助通过Seldinger技术自动导管插入的最终目标的重大步骤。

Search-based Path Planning for a High Dimensional Manipulator in Cluttered Environments Using Optimization-based Primitives
Authors Muhammad Suhail Saleem, Raghav Sood, Sho Onodera, Rohit Arora, Hiroyuki Kanazawa, Maxim Likhachev
在这项工作中，我们为21维蛇机器人处理了机械手的路径规划问题，用于检查杂乱的燃气轮机以用于检查。基于启发式搜索的方法是共同操纵域的有效规划策略。然而，它们在高维系统上的性能严重依赖于动作空间和所选启发式的有效性。我们的系统，可达性限制和高度杂乱的涡轮环境的复杂性质使行动空间和启发式无效的朴素选择。在这方面，我们开发了基于在线优化的动态产生动态的方法，帮助机器人导航窄空间，ii一种懒散地产生这些计算昂贵的优化动作，以有效利用资源，以及III启发式诱导的同型课程的启发式由机器人工作区中的涡轮机的刀片和多种启发式框架，其指导沿相关类搜索。通过模拟实验研究提出了我们贡献的影响，其中21个Dof操纵器导航到涡轮机内的检查区域。

MPLP: Massively Parallelized Lazy Planning
Authors Shohin Mukherjee, Sandip Aine, Maxim Likhachev
已经开发了惰性搜索算法以有效地解决计算工作以边缘评估成本为主导的域中的规划问题。目前的方法通过智能地平衡在搜索图形和评估边缘之间进行计算工作来操作。然而，这些算法旨在作为单一过程运行，并且不利用现代处理器的多线程能力。在这项工作中，我们提出了一种巨大的并行化，有界次优，懒惰搜索算法MPLP，其利用现代多核处理器。在MPLP中，对图形和边缘评估的搜索并行地进行完全异步地进行，导致规划时间发生了剧烈改善。我们验证了两个不同规划域的建议算法，用于人为控制机器箱的人形导航和任务和运动规划。我们表明MPLP优于艺术惰性搜索的状态以及并行搜索算法。

HIDA: Towards Holistic Indoor Understanding for the Visually Impaired via Semantic Instance Segmentation with a Wearable Solid-State LiDAR Sensor
Authors Huayao Liu, Ruiping Liu, Kailun Yang, Jiaming Zhang, Kunyu Peng, Rainer Stiefelhagen
独立探索未知的空间或在室内环境中寻找对象是视力受损人物的日常但具有挑战性的任务。然而，共同的2D辅助系统缺乏各种物体之间的深度关系，导致难以获得准确的空间布局和物体的相对位置。为了解决这些问题，我们提出了一种基于3D点云实例分割的轻量级辅助系统，采用固态激光雷达传感器，用于整体室内检测和避免。我们的整个系统由三个硬件组件组成，两个交互功能障碍避免和对象查找和语音用户界面。基于语音指导，通过用户执行的现场扫描捕获来自更改室内环境的最新状态的点云。此外，我们设计了一个点云分割模型，具有双重轻量级解码器，用于对语义和偏移预测的语义和偏移预测，满足整个系统的效率。在3D实例分割之后，通过删除异常值并将所有点投影到顶视图2D地图表示中，我们发布了分段点云。该系统将上述信息集成并通过声反馈直观地与用户相互作用。所提出的3D实例分段模型已经实现了SCANNet V2数据集的最新性能。在用户学习中具有各种任务的综合现场测试验证了我们系统的可用性和有效性，以协助全面的室内理解，避免障碍和对象搜索的视力受损人员。

Trans4Trans: Efficient Transformer for Transparent Object Segmentation to Help Visually Impaired People Navigate in the Real World
Authors Jiaming Zhang, Kailun Yang, Angela Constantinescu, Kunyu Peng, Karin M ller, Rainer Stiefelhagen
常见的完全玻璃外墙和透明物体存在架构障碍，并且妨碍了低视觉或失明的人的移动性，例如，除非正确地感知和反应，否则无法进入玻璃门后检测到的路径。然而，分割这些安全关键对象很少被传统辅助技术覆盖。为了解决这个问题，我们用一种用于透明的双头变压器的可穿戴系统，用于透明度Trans4trans模型，它能够分割一般和透明的物体，并执行实时Wayfinding，以帮助更安全地行走的人。特别是，由我们提出的变换器解析模块TPM创建的两个解码器都能从不同的数据集启用有效的联合学习。此外，由基于对称变压器的编码器和解码器组成的有效Trans4Trans模型需要很少的计算费用，并且易于部署在便携式GPU上。我们的Trans4Trans模型优于Stanford2D3D和Trans10k V2数据集的测试组现有技术的状态，并分别获得45.13和75.14的MIOU。通过各种预测试和在室内和户外场景中进行的用户学习，我们的辅助系统的可用性和可靠性已被广泛验证。

Minimum Constraint Removal Problem for Line Segments is NP-hard
Authors Bahram Sadeghi Bigham
在最小约束移除MCR中，没有可行的路径可以从起点朝向目标移动，并且应删除最小限制以便找到碰撞路径。已经证明，当约束具有任意形状或甚至它们的形状为凸多边形时，MCR问题是NP。但是，当约束是线路时，它具有一个简单的线性解决方案，并且对于其他案例，问题是开放的。在本文中，使用子集合问题的减少，三个步骤，我们表明，对于加权和未加权线段，问题是NP。

Supervised Bayesian Specification Inference from Demonstrations
Authors Ankit Shah, Pritish Kamath, Shen Li, Patrick Craven, Kevin Landers, Kevin Oden, Julie Shah
在观察任务演示时，人类学徒能够在获得实际执行该任务的专业知识之前，可以识别给定的任务是否正确执行。从演示中学习的先前研究LFD未能捕获该任务执行的可接受性的概念，同时，时间逻辑提供了一种用于表达任务规范的灵活语言。灵感来自于此，我们呈现贝叶斯规范推断，一种推断任务规范作为时间逻辑公式的概率模型。我们将方法从概率编程中融合到定义我们的前沿，以及域独立似然函数，以实现基于采样的推断。我们展示了我们模型对推断规范的功效，观察到的推断说明和地面真理之间观察到的90多个相似性，无论是在合成领域和真实的世界表设置任务中。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com