AI视野·今日CS.Robotics 机器人学论文速览
Thu, 17 Jun 2021
Totally 15 papers
👉上期速览更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Autonomous Navigation System for a Delivery Drone
Authors Victor R. F. Miranda, Adriano M. C. Rezende, Thiago L. Rocha, H ctor Azp rua, Luciano C. A. Pimenta, Gustavo M. Freitas
送货服务的使用是全球趋势的日益趋势,由Covid Pandemic进一步增强。在这种情况下,无人机递送系统具有很大的兴趣,因为它们可能允许更快,更便宜的交付。本文介绍了一个导航系统,可行的自主无人机交付包裹。系统在开始和最终点之间生成路径,并根据通过GPS,9DOF IMU和晴雨表获得的本地化来控制无人机以遵循该路径。在降落阶段,通过利用扩展的卡尔曼滤波器算法来改善着陆精度,通过使用相机,超宽带UWB装置和无人机软件估计来利用标记ARUCO检测技术估计的姿势信息。基于矢量场的方法控制无人机平稳地遵循所需的路径,减少可能损害运输包裹的振动或苛刻运动。真实实验验证了交付策略并允许评估采用技术的性能。初步结果说明我们对自主无人机交付的建议的可行性。

GelSight Wedge: Measuring High-Resolution 3D Contact Geometry with a Compact Robot Finger
Authors Shaoxiong Wang, Yu She, Branden Romero, Edward Adelson
基于视觉的触觉传感器有可能提供重要的接触几何形状,以通过视觉遮挡本地化目标。然而,测量紧凑型机器人手指的高分辨率3D接触几何体是挑战,同时满足光学和机械约束。在这项工作中,我们介绍了Gelight Wedge传感器,该传感器经过优化,为机器人手指具有紧凑的形状,同时实现高分辨率的3D重建。我们在不同的照明配置下评估3D重建,并将方法从3灯延伸到1或2灯。我们通过将传感器缩小到人体手指的尺寸以进行微细操作任务来证明设计的灵活性。我们还显示了在3D空间中姿态跟踪的重建3D几何的有效性和潜力。

Optical Tactile Sim-to-Real Policy Transfer via Real-to-Sim Tactile Image Translation
Authors Alex Church, John Lloyd, Raia Hadsell, Nathan F. Lepora
仿真最近成为深度加强学习,安全有效地从视觉和预读性投入获取一般和复杂的控制政策的关键。尽管它与环境互动直接关系,但务必通常不考虑。在这项工作中,我们展示了一套针对触觉机器人和加强学习量身定制的模拟环境。提供了一种简单且快速的模拟光学触觉传感器的方法,其中高分辨率接触几何形状表示为深度图像。近端策略优化PPO用于学习所有考虑的任务的成功策略。数据驱动方法能够将实际触觉传感器的当前状态转换为对应的模拟深度图像。该策略在物理机器人上的实时控制循环中实现,以将零拍摄SIM展示到实际策略转移,以进行触摸感的几种物理交互式任务。

Latent Representation in Human-Robot Interaction with Explicit Consideration of Periodic Dynamics
Authors Taisuke Kobayashi, Shingo Murata, Tetsunari Inamura
本文介绍了一种新的数据驱动框架,用于分析潜在状态空间中的周期性物理人员机器人互动PHRI。为了在PHRI期间详细说明人类的理解和或机器人控制,代表PHRI的模型至关重要。最近的深度学习技术的发展将使我们能够从实际的PHRI收集的数据集中学习这样的模型。我们的框架是基于变分频复制神经网络VRNN开发的,它可以本身可以处理一个PHRI生成的时间序列数据。本文修改了VRNN,以便将机器人与人类的潜在动力学明确。此外,为了分析像步行等的周期性运动,我们基于储层计算RC集成了一种新的经常性网络,其在众多神经元之间具有随机和固定的连接,具有VRNN。通过将RC增进复杂域,可以将周期性行为表示为复杂域中的相位旋转,而不会衰减幅度。为了验证所提出的框架,分析了绳索旋转摆动实验。拟议的框架,在从实验中收集的数据集上训练,实现了可以区分周期运动的差异的潜在状态空间。这种良好的杰出空间产生了人类观察的最佳预测准确性和机器人动作。附加的视频可以在YouTube中看到

GKNet: grasp keypoint network for grasp candidates detection
Authors Ruinian Xu, Fu Jen Chu, Patricio A. Vela
当代掌握检测方法采用深度学习,实现传感器和物体模型不确定性的鲁棒性。这两个主导方法设计掌握质量评分或基于锚的掌握识别网络。本文通过将其视为键点检测来呈现掌握检测的不同方法。深网络检测每个把握候选者作为一对关键点,可转换为掌握表示G x,y,w,theta t,而不是角点的三重态或四倍。通过将关键点分组成对来降低检测难度提升性能。为了进一步促进关键点之间的依赖性,将常规非本地模块结合到所提出的学习框架中。基于离散和连续定向预测的最终过滤策略消除了错误的对应关系,并进一步提高了掌握检测性能。 GKNET,此处介绍的方法,在41.67和23.26 FPS下实现了康奈尔和伸缩的提花数据集96.9和98.39上的准确性和速度的最佳平衡。在操纵器上进行跟进实验,使用4种类型的抓取实验评估GKNet,反映不同滋扰源的静态抓握,动态抓握,在各种摄像机角度抓住,垃圾挑选。 GKNet优于静态和动态掌握实验中的参考基线,同时显示了变化的相机观点和垃圾拣选实验的鲁棒性。结果证实了掌握关键点是深度掌握网络的有效输出表示的假设,为预期的滋扰因素提供鲁棒性。

Enabling AI and Robotic Coaches for Physical Rehabilitation Therapy: Iterative Design and Evaluation with Therapists and Post-Stroke Survivors
Authors Min Hun Lee, Daniel P. Siewiorek, Asim Smailagic, Alexandre Bernardino, Sergi Berm dez i Badia
人工智能AI和机器人教练承诺通过社会互动提高患者对康复练习的敬业。虽然以前的工作探讨了自动监控AI和机器人教练的练习的潜力,但这些系统的部署仍然是一个挑战。以前的工作描述了缺乏利益相关者将这些功能设计为主要原因之一。在这篇论文中,我们介绍了诱因关于AI和机器人教练如何与之互动的详细设计规范,并以有效且可接受的方式与四个治疗师和五个后卒中幸存者以有效且可接受的方式引导患者的练习。通过迭代问卷和访谈,我们发现,中风幸存者和治疗师的职位赞赏艾迪和机器人教练的潜在利益,以实现更系统的管理,提高他们对康复治疗的自我功效和动机。此外,我们的评估揭示了几种实际问题。对具有认知障碍,系统故障等人的互动的可能困难。我们讨论了补充系统失败的利益相关者和互动技术的早期参与的价值,也支持个性化治疗会议,以便更好地部署AI和机器人练习教练。

Imitation and Mirror Systems in Robots through Deep Modality Blending Networks
Authors M. Y. Seker, A. Ahmetoglu, Y. Nagai, M. Asada, E. Oztop, E. Ugur
学习与环境互动不仅使得代理具有操纵能力,还可以生成信息,以便于构建行动理解和仿制功能。这似乎是生物系统,特别是灵长类动物所采用的策略,如镜子神经元的存在所证明,似乎涉及多种模态行动理解。如何从机器人的互动经验中受益,以实现其他代理人的操作和目标仍然是一个具有挑战性的问题。在这项研究中,我们提出了一种新的方法,深层模态混合网络DMBN,其通过用随机加权机构混合多模态信号来产生来自机器人的多模态体验的共同潜在的潜伏空间。我们首次展示深入学习,当与新的模型混合方案结合时,可以促进动作识别并产生结构以维持基于解剖学和基于效果的仿制功能。我们提出的系统可以在任何时间步骤调节在任何所需的感官电动机值上,并且可以产生与并行避免预测误差累积的所需调节的完整多模态轨迹。我们进一步表明,给出了来自不同观点的所需图像,即通过观察放置在表格的不同侧的其他机器人而产生的图像,我们的系统可以产生对应于基于解剖学或效果的模拟行为的图像和关节角度序列。总的来说,所提出的DMBN架构不仅用作维持镜子神经元的计算模型,而且作为能力的强大机器学习架构,而且是具有在一个或多个模式中的部分信息操作的强大的检索能力的强大机器学习体系结构。

Plane and Sample: Maximizing Information about Autonomous Vehicle Performance using Submodular Optimization
Authors Anne Collin, Amitai Y. Bin Nun, Radboud Duintjer Tebbens
随着自主车辆的AVS承担日益增长的运营设计领域,他们需要通过系统,透明和可扩展性的评估过程来展示他们对社会的好处。目前的VAV性能评估的采样技术通常专注于特定功能,例如车道更改,并且不会容纳关于AV系统的信息从一个奇数到接下来的信息。在本文中,我们将跨越赔率和功能的方案采样问题进行重构,作为子模块优化问题。为此,我们将AV性能作为贝叶斯分层模型,我们用于通过在新场景中揭示性能来推断出来的信息。我们提出了信息收益作为方案相关性和评估进展的衡量标准。此外,我们利用子骨折或递减的回报,信息的财产不仅可以找到近乎最佳场景集,而且还提出停止AV性能评估活动的标准。我们发现我们只需要探索大约7.5个方案空间,以满足此标准,这是在拉丁超立方体采样的改进。

A Multi-Layered Approach for Measuring the Simulation-to-Reality Gap of Radar Perception for Autonomous Driving
Authors Anthony Ngo, Max Paul Bauer, Michael Resch
随着自动驾驶汽车释放的越来越多的安全验证要求,除了传统的现实世界测试之外,还出现了基于模拟的测试等替代方法。为了依靠虚拟测试,必须验证采用的传感器模型。因此,有必要量化模拟和现实之间的差异,以便确定某些保真度是否足以用于所需的预期用途。没有声音方法可以测量此模拟,以实现自动驾驶的雷达感知的现实差距。我们通过引入多层评估方法来解决这个问题,该方法包括显式和隐式传感器模型评估的组合。前者直接评估了合成产生的传感器数据的现实主义,而后者是指对下游目标应用的评估。为了展示该方法,我们评估了三种典型雷达模型类型的保真度理想,数据驱动,光线跟踪的基础和其适用性,以及基于基于雷达的多目标跟踪。我们已经在提供了在深度传感器模型评估方面显示了所提出的方法的有效性,使得呈现现有差异可见并且能够估计不同场景的整体模型保真度。

Amortized Synthesis of Constrained Configurations Using a Differentiable Surrogate
Authors Xingyuan Sun, Tianju Xue, Szymon M. Rusinkiewicz, Ryan P. Adams
在设计,制造和控制问题中,我们通常面临合成的任务,其中我们必须生成满足一组约束的对象或配置,同时最大化一个或多个客观函数。合成问题通常是一种物理过程,其中许多不同的实现可以实现目标。这很多到一个地图对前馈合成的监督学习具有挑战,因为该组可行的设计可能具有复杂的结构。此外,许多物理模拟的不可分化性质可防止直接优化。我们通过两个阶段神经网络架构来解决这两个问题,我们可以考虑成为AutoEncoder。我们首先学习解码器是一个可怜的代理,近似于一个物理实现过程。然后,我们学习编码器,从目标设计到设计,同时使用固定解码器评估实现的质量。我们评估了两种案例研究挤出机路径规划的方法,包括约束软机器逆运动学。我们比较我们使用学到的代理商直接优化设计的方法,并监督综合问题的学习。我们发现,我们的方法可以产生更高质量的解决方案,而不是监督学习,同时具有直接优化的质量竞争,计算成本大大降低。

Surgical task expertise detected by a self-organizing neural network map
Authors Birgitta Dresp Langley, Rongrong Liu, John M. Wandeto
使用专为内窥镜手术设计的机器人控制装置的专家和新手的个人抓握力分析,专门用于内窥镜手术的机器人控制装置允许定义基准标准,从新手或实习外科医生的技能中讲述真正的专家任务技能。握力变异在真正的专家和执行机器人辅助外科模拟器任务的完整新手揭示了作为任务专业知识的函数的统计上显着的差异。在这里,我们表明,本地抓地力的技能特定差异是通过自组织神经网络映射SOM的输出度量来预测具有生物启发功能架构的生物鼓励功能架构,其映射着灵长类大脑中的躯体感觉神经网络的功能连接。

The Oxford Road Boundaries Dataset
Authors Tarlan Suleymanov, Matthew Gadd, Daniele De Martini, Paul Newman
在本文中,我们介绍了牛津道路边界数据集,专为培训和测试机器学习的道路边界检测和推理方法。我们的手从牛津机器人数据集中发出了10公里长的两个,并从其他几千个进一步的例子与半注释的道路边界面具。为了以这种方式提高培训样本的数量,我们使用基于视觉的本地用户将注释的数据集项目标签投影到不同时间和天气条件的其他遍历。结果,我们释放了62605个标记的样品,其中凝固47639个样品。这些样本中的每一个都包含左镜头和右镜头的原始和分类掩模。我们的数据包含各种情景集,如直路,停放的汽车,接合量等。用于操纵标记数据的下载和工具的文件

Unsupervised Lexical Acquisition of Relative Spatial Concepts Using Spoken User Utterances
Authors Rikunari Sagara 1 , Ryo Taguchi 1 , Akira Taniguchi 2 , Tadahiro Taniguchi 2 , Koosuke Hattori 3 , Masahiro Hoguro 3 , Taizo Umezaki 3 1 Nagoya Institute of Technology, 2 Ritsumeikan University, 3 Chubu University
本文提出了使用口语用户话语的相对空间概念的无监督词汇收购的方法。具有灵活的对话系统的机器人必须能够通过与人类的互动来获取语言表征及其特定于环境的含义。具体而言,相对空间概念例如,正面和右边广泛用于我们的日常生活中,然而,当机器人学习相对空间概念时,这是一个不明显的物体是参考对象。因此,我们提出了一种没有先验知识知识的机器人可以学习相对空间概念的方法。使用概率模型制定该方法,以估计同时表示概念的适当参考对象和分布。实验结果表明,可以在机器人不知道哪个定位对象是引用对象的情况下学习相对空间概念和表示每个概念的音素序列。另外,我们示出了所提出的方法中的两个过程通过类别NGRAM提高生成候选词序列的概念的估计精度,并使用位置信息选择单词序列。此外,我们表明,即使候选参考对象的数量增加,则引用对象的线索提高了准确性。

Scene Transformer: A unified multi-task model for behavior prediction and planning
Authors Jiquan Ngiam, Benjamin Caine, Vijay Vasudevan, Zhengdong Zhang, Hao Tien Lewis Chiang, Jeffrey Ling, Rebecca Roelofs, Alex Bewley, Chenxi Liu, Ashish Venugopal, David Weiss, Ben Sapp, Zhifeng Chen, Jonathon Shlens
预测多个代理的未来运动是在动态环境中规划所必需的。这项任务对自动驾驶的挑战,因为代理商驾驶,例如,车辆和行人及其相关行为可能多样化并相互影响。大多数事先工作都集中在首先根据所有过去的动议预测每个代理的独立期货,然后规划这些独立预测。然而,针对固定预测的计划可能会因无法代表不同代理商之间的未来互动可能性而导致次优化规划。在这项工作中,我们以统一的方式制定了一种用于预测现实世界驾驶环境中共同的所有代理的行为的模型。灵感来自最近的语言建模方法,我们使用掩蔽策略作为我们模型的查询,使能够在许多方面调用一个模型来预测代理行为,例如潜在地对自主车辆的目标或全部将来轨迹或全新的轨迹其他代理人在环境中的行为。我们的模型建筑通过在道路元素,代理交互和时间步骤中使用注意力来融合统一的变压器架构中的异质世界状态。我们评估我们在自动驾驶数据集中进行行为预测的方法,实现最先进的性能。我们的工作表明,使用掩蔽策略的统一架构中的行为预测问题可以允许我们具有可以有效地执行多个运动预测和规划相关任务的单个模型。

Model Predictive Control with and without Terminal Weight: Stability and Algorithms
Authors Wen Hua Chen
本文为模型预测控制MPC提供了稳定性分析工具,具有终端重量。具有有限地平线但没有终端重量的MPC的稳定性分析是一个长期的开放问题。通过使用改进的值函数作为Lyapunov功能候选者和最优性原理,本文对这种广泛扩展的MPC算法建立了稳定性条件。提出了一种没有终端重量MPC的新稳定性保证MPC算法。借助设计了由一个步骤成本的一个步骤成本的价值函数定义的新的Sublevel设置,提出了用于检查其递归可行性和所提出的MPC算法的稳定性的条件。新的稳定性条件和导出的MPCs克服了现有的基于终端权重的MPC框架中产生的困难,包括需要搜索合适的终端重量和可能由不适当的终端重量引起的差的性能。该工作进一步扩展到MPC,终端重量为完整性。提出了数值例证以证明所提出的工具的有效性,而现有的稳定性分析工具是不适用的或导致相当保守的结果。它表明,所提出的工具提供了许多机制来实现稳定性调整状态和或控制权重,延长地平线的长度,并在优化中向第一或第二状态添加简单的额外约束。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐