OpenPose 升级，CMU提出首个单网络全人体姿态估计网络，速度大幅提高

2024-08-05 02:22:37

昨天，曾经开源OpenPose的卡内基梅隆大学（CMU）公布了ICCV 2019 论文 Single-Network Whole-Body Pose Estimation，提出一种在单一网络实现全人体姿态估计的算法，相对OpenPose大幅提高了速度。

如下图：

在OpenPose只能达到帧率1.6 fps的图像上，该文提出的算法运行帧率可达到13.2 fps，且精度还有改进。

该文作者信息：

作者来自卡内基梅隆大学、RetailNext公司、Facebook AI 研究院。

所谓全人体姿态估计，即对人体躯干、人脸、手部都进行姿态估计，这可以通过先检测人体躯干关键点，然后再针对人脸和手部进行单独的关键点定位实现，这也是OpenPose的做法。

但这种方法需要多个姿态估计网络，速度并不快。

作者希望在OpenPose算法框架下，使用单一网络实现全人体的姿态估计。

下图为该文提出算法流程图：

作者是在论文OpenPose: realtime multi-person 2D poseestimation using Part Affinity Fields 基础上进行了改进，将原本人脸、手部 Part Affinity Fields直接合并进入人体的Part Affinity Fields，进行多任务学习，实现上述功能。

作者提出的算法在人体Body-foot 部位数据集与OpenPose的精度比较：

作者提出的算法在人脸数据集与OpenPose的精度比较：

作者提出的算法在手部数据集与OpenPose的精度比较：

可见，该文提出的算法相比OpenPose精度相当，或有小幅提高。

算法运行速度的比较：

可见该文提出的算法随着图像中人数的增加，运行时间不变，而OpenPose则随着人数线性增长，该文提出的算法在多人全人体姿态估计任务上是OpenPose速度的N倍，N为图像中人数。

论文地址：

https://arxiv.org/pdf/1909.13423v1.pdf

代码地址：

https://github.com/CMU-Perceptual-Computing-Lab/openpose_train

赞 (0)

(2条消息) 六种人体姿态估计的深度学习模型和代码总结

姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测.姿态估计.分割等等.有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形.增强现实或者人机交互 ...
PFLD：高精度实时人脸关键点检测算法

重磅干货,第一时间送达本文转自:AI算法与图像处理这篇文章作者分别来自天津大学.武汉大学.腾讯AI实验室.美国天普大学.该算法对在高通ARM 845处理器可达140fps:另外模型大小较小,仅2. ...
常用的9个人脸数据库

AMiner明日将发布<人脸识别研究报告> 届时微信公众号菜单栏和文末均可直接下载研究报告欢迎大家下载本文主要介绍以下几种常用的人脸数据库: (1)FERET人脸数据库 http:// ...
这项技术，让指纹、人脸、虹膜都“弱爆”了！

图片来源:unsplash 破解三重物理旋转密码锁和指纹锁后,阿汤哥的搭档又得经受步态识别锁的考验--这一场景出现在2015年上映的<碟中谍5>中,至今仍令人印象深刻. 在影片中,多个摄像 ...
CV之MobiLenet：基于openpose利用CMU/MobilenetV2算法实现对多人体姿态(2019湖人勒布朗詹姆斯扣篮)实时估计检测

CV之MobiLenet:基于openpose利用CMU/MobilenetV2算法实现对多人体姿态(2019湖人勒布朗詹姆斯扣篮)实时估计检测输出结果设计思路更新-- 1.Build c++ ...
CV之DNN：基于OpenPose的OpenCV利用DNN算法实现对单人体姿态(詹姆斯扣篮+美女跳舞)实时估计检测

CV之DNN:基于OpenPose的OpenCV利用DNN算法实现对单人体姿态(詹姆斯扣篮+美女跳舞)实时估计检测输出结果实现代码 CV之DNN:基于OpenPose的OpenCV利用DNN算法实 ...
(2条消息) Python+OpenCV+OpenPose实现人体姿态估计（人体关键点检测）

目录 1.人体姿态估计简介 2.人体姿态估计数据集 3.OpenPose库 4.实现原理 5.实现神经网络 6.实现代码 1.人体姿态估计简介人体姿态估计(Human Posture Estimat ...
“看墙之外” ——遮挡下的人体姿态估计

点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达在过去的许多科幻电影中,能够看到墙外的东西被认为是超能力.2011 ...
无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

作者|Happy 编辑丨极市平台极市导读该文是CMU的Zhiqiang Shen提出的一种提升标准ResNet50精度的方法,它应该是首个将ResNet50的Top1精度刷到80%+的(无需额外数 ...
用 Python 实现抖音尬舞机

如今说到体感游戏,大家一定都不陌生,比如微软的 Kinect.任天堂的 Switch,都曾是游戏业的革命性产品.而另一款网红产品-抖音,也在去年底上线过一个"尬舞机"的音乐体感游戏 ...