开源论文推荐:含人脸识别、实例分割、跟踪、SR等

CV君 我爱计算机视觉 3天前

原文地址:https://mp.weixin.qq.com/s/PGz4RnecwHM1nQMBaGAP5g

我爱计算机视觉

周刊论文分享包含超分辨率、用于实时防暗无人机追踪器、实例分割、人脸识别、图像和谐化等,共计 7 篇。

      01      

MASA-SR: Matching Acceleration and Spatial Adaptation for Reference-Based Image Super-Resolution

来自港中文&快手&思谋科技

基于参考的图像超分辨率通过利用外部参考图像进行恢复高频细节方面取得了成功。其中纹理细节是根据它们的 point- 或 patch-wise 对应关系从参考图像迁移到低分辨率(LR)图像。因此,高质量的对应关系匹配是至关重要的。现有的 RefSR 方法往往忽略了 LR 和 Ref 图像之间隐藏的巨大分布差异,使得信息利用的有效性降低。

本次工作中,作者提出用于 RefSR 的新方法:MASA 网络,设计两个新的模块来解决上述问题。所提出的 Match (匹配)和 Extraction(提取)模块通过一个从粗到细的对应匹配方案大大降低了计算成本。Spatial Adaptation(空间适应)模块用来学习 LR 和 Ref 图像之间的分布差异,并以空间适应的方式将参考特征的分布 remaps(重新映射)为 LR特征的分布。以此更加鲁棒地处理不同的参考图像。大量的定量和定性实验验证了所提出的模型的有效性。

  • 论文链接:https://arxiv.org/abs/2106.02299

  • 项目链接:https://github.com/dvlab-research/MASA-SR

图片

标签:CVPR 2021+超分辨率

      02      

ADTrack: Target-Aware Dual Filter Learning for Real-Time Anti-Dark UAV Tracking

来自同济大学

同济大学学者提出一种具有防暗功能的新型跟踪器(ADTrack)。所提出的方法将一个高效的低照度图像增强器整合到一个基于 CF 的跟踪器中。此外,凭借图像的光照变化,还同时产生了一个目标感知的掩码。目标感知掩码可用于联合训练以目标为重点的滤波器,该滤波器可协助上下文滤波器进行鲁棒性跟踪。具体来说,ADTrack 采用双重回归,在双重过滤器的学习中,上下文过滤器和以目标为中心的过滤器相互制约。

在典型的黑暗场景基准上进行了详尽的实验,包括来自权威基准的 37 个典型夜间序列,即 UAVDark 和所新构建的基准 UAVDark70。结果表明,ADTrack 的性能优于其他最先进的跟踪器,在单个 CPU 上实现了 34 帧/秒的实时速度,大大扩展了对夜间场景的强大无人机跟踪。

  • 论文链接:https://arxiv.org/abs/2106.02495

  • 项目链接:https://github.com/vision4robotics/ADTrack

图片

    标签:无人机跟踪+遥感图像     

      03      

SOLQ: Segmenting Objects by Learning Queries

来自旷视

旷视研究员提出一个用于实例分割的端到端框架:SOLQ,是基于近期所提出的 DETR,通过学习统一的查询来分割目标。在 SOLQ 中,每个查询代表一个对象,并有多种表现形式:class, location 和 mask。所学的目标查询以统一的矢量形式同时进行分类、box regression 和掩码编码。

实验结果表明,SOLQ 超过了大多数现有的方法,实现了新的 SOTA。此外,统一查询表示法的联合学习可以极大地提高原始 DETR 的检测性能。作者称希望 SOLQ 可以作为基于 Transformer 实例分割的一个强有力的基线。

  • 论文链接:https://arxiv.org/abs/2106.02351

  • 项目链接:https://github.com/megvii-research/SOLQ

图片

      标签:实例分割      

      04      

Cross-Domain Gradient Discrepancy Minimization for Unsupervised Domain Adaptation

来自电子科技大学&山东师范大学

CGDM:一种无监督域适应方法,采用基于聚类的自监督学习来获得更可靠的目标样本伪标签,减少模糊的目标样本数量。 

  • 论文链接:https://arxiv.org/abs/2106.04151

  • 项目链接:https://github.com/lijin118/CGDM

图片

       标签:域适应+CVPR 2021       

      05      

Region-aware Adaptive Instance Normalization for Image Harmonization

来自上海交通大学

上海交通大学研究学者在本次的主要研究工作是解决图像和谐化中视觉风格一致的问题。具体来说,提出一个简单而有效的 Region-aware Adaptive Instance Normalization(RAIN)模块,明确地制定来自背景的视觉风格,并自适应地将它们应用到前景中。通过这样的设置,RAIN 模块可以作为现有图像和谐化网络的落地模块,并且能够带来显著的改进。并在现有的图像和谐化基准数据集上进行的广泛实验证明了所提出方法的卓越性能。

  • 论文链接:https://arxiv.org/abs/2106.02853

  • 项目链接:https://github.com/junleen/RainNet

图片

标签:CVPR 2021+图像和谐化

      06      

Consistent Instance False Positive Improves Fairness in Face Recognition

来自腾讯优图&南京理工大学

问题:人口统计学上的偏差是实用人脸识别系统的一个重大挑战。而现有方法在很大程度上依赖于准确的人口统计学标注,在真实场景中通常是不可用的,多为特定的人口群体设计,不够普遍。

方案:提出一种假阳性率惩罚损失,通过提高实例 False Positive Rate(FPR)的一致性来减轻人脸识别的偏差。具体来说,首先将实例 FPR 定义为超过统一阈值的非目标相似性数量与非目标相似性总数之间的比率。其中统一的阈值是针对给定的总 FPR 而估计的。然后,在基于 softmax 的损失的分母中引入一个额外的惩罚项,该惩罚项与实例 FPR 总体 FPR 的比例成正比。实例 FPR 越大,惩罚就越大。通过这种不平等的惩罚,实例的 FPR 应该是一致的。与以前的 debiasing 方法相比,该方法不需要人口统计学标注。因此,可以减轻由各种属性划分的人口群体之间的偏差,而且这些属性不需要在训练中预定义。

结果:在流行基准上的广泛的实验结果表明,所提出方法比最先进的竞争对手更有优势。

  • 论文链接:https://arxiv.org/abs/2106.05519

  • 项目链接:https://github.com/Tencent/TFace

图片

       标签:人脸识别+CVPR 2021         

      07      

Plan2Scene: Converting Floorplans to 3D Scenes

来自西蒙菲莎大学

本次所研究任务是将住宅的平面图和一组相关的照片转换为纹理的三维网格模型,设计一个系统:Plan2Scene,可以将平面图图像提升到三维网状模型;根据输入的照片合成表面纹理;使用图神经网络架构推断未观察到的表面纹理。并创建一个室内表面纹理数据集,将先前工作中的平面图和照片数据集增加了修正的表面裁剪和额外的标注,以对该系统进行训练和评估。

其中所完成的挑战是从一组稀疏的、只覆盖住宅的不对齐的照片中为主要的表面(如地板、墙壁和天花板)制作可贴瓷砖的纹理。

结果:实验结果表明所设计系统可以生成逼真的三维室内模型,在一系列纹理质量指标上优于基线方法,并通过全面的用户研究来衡量。

  • 论文链接:https://arxiv.org/abs/2106.05375

  • 项目链接:https://github.com/3dlg-hcvc/plan2scene

  • 主页链接:https://3dlg-hcvc.github.io/plan2scene/

图片

标签:三维场景+CVPR 2021

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐