深度学习人体姿态估计：2014-2020全面调研

今天分享一篇人体姿态估计综述。

来自北卡夏洛特, 戴顿大学, 德州大学达拉斯分校,中佛罗里达大学的研究人员对该领域的研究发展进行了综述。基于输入数据和推理程序的系统分析和比较，作者对基于深度学习的 2D 和 3D 姿态估计解决方案进行全面回顾，其中涵盖了自2014 年以来 240 余篇相关研究论文。同时还提供了定期更新的 github 项目。

论文链接：https://arxiv.org/pdf/2012.13392.pdf
项目链接：https://github.com/zczcwh/DL-HPE

摘要

人体姿势估计的研究目标是根据图像和视频等输入数据来定位人体部位并建立人体表现形式（例如人体骨骼）。在过去的十年中，它引起了越来越多的关注，并已被广泛用于包括人机交互，运动分析，增强现实和虚拟现实的应用中。

尽管最近基于深度学习的人体姿势估计研究已经取得了很好的效果，但是训练数据不足，深度模糊和遮挡等挑战依旧存在。本调查论文的目的是通过基于输入数据和推理程序的系统分析和比较，对基于深度学习的2D和3D姿态估计解决方案进行全面回顾。

该调查涵盖了自2014年以来240余篇研究论文。此外，论文还包括2D和3D人类姿势估计数据集和评估指标。总结并讨论了在大众化数据集上所审查方法的定量性能比较。最后，总结了所涉及的挑战，应用和未来的研究方向

与之前的综述论文对比

该综述提供了更系统更全面的2D和3D人体姿态估计的归纳和讨论，数据集汇总和结果对比，人体姿态估计的应用总结，以及未来研究方向的讨论。

本调研主要贡献有以下几点：

根据单眼图像/视频或其他来源的 2D 或 3D 场景，对单视图或多视图HPE方法进行分类并提供了最新的基于深度学习的 2D 和 3D HPE 方法的全面回顾（直至 2020 年）。
2D 和 3D HPE 方法的广泛性能评估。我们根据不同方法类别对常用数据集上算法性能进行了总结和比较。并讲解了不同方法的优势和劣势，揭示了 HPE的研究趋势和未来研究方向。
详尽介绍了各种HPE的应用场景，例如游戏，监视，AR / VR和医疗保健。
就 2D 和 3D HPE 的主要挑战提出了有见地的讨论，指出了潜在的研究方向以提高算法性能。