推荐！京东开源姿态跟踪新框架LightTrack！

2024-07-30 00:41:28

也是最近最值得参考的姿态跟踪方面的工作～

在论文《LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking》中，作者详细介绍了该算法框架。

该论文是由京东数字科技美国研发中心的研究人员发表的。

姿态跟踪

姿态跟踪是指在视频中对多人进行姿态关键点定位与跟踪，这是一项综合性技术，如下图所示，展示了LightTrack 框架的的主要部分。

LightTrack采用的是置顶向下的姿态估计方法，即先检测到人体，然后再针对每个人进行人体关键点定位。

在跟踪的过程中，涉及到姿态估计、目标跟踪成功、目标丢失等状态的转换。

另外，因为是对多人跟踪，所以涉及到对不同帧中人体个体的关联。

LightTrack是一种在线计算的姿态跟踪，即只使用当前帧及之前的视频帧，这更加符合现实中实时应用的场景。而很多离线计算的姿态跟踪，则会使用未来帧的数据。

所以这是一项综合性的计算机视觉问题，涉及到目标检测、姿态估计、多目标跟踪、行人重识别，并需要协同配合。

LightTrack算法方案

人体检测部分使用Deformable FPN算法，来自论文：

J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, andY. Wei. Deformable convolutional networks. CoRR,abs/1703.06211, 1(2):3, 2017.

T.-Y. Lin, P. Dollar, R. B. Girshick, K. He, B. Hariharan, and ´S. J. Belongie. Feature pyramid networks for object detection. In CVPR, volume 1, page 3, 2017.

使用论文提供的预训练模型。

检测只在关键帧做。

单人姿态估计部分使用CPN101 与 MSRA152模型，分别来自论文：

Y. Chen, Z. Wang, Y. Peng, Z. Zhang, G. Yu, and J. Sun.Cascaded Pyramid Network for Multi-Person Pose Estimation. In CVPR, 2018.

B. Xiao, H. Wu, and Y. Wei. Simple baselines for humanpose estimation and tracking. ECCV, 2018.

并做了轻微改进。

多目标跟踪和行人重识别部分，作者将其建模为姿态匹配问题，即在上一帧人体位置扩大范围（+20%）进行单人姿态估计，如果检测到人体姿态，则将这些人体姿态与上一帧人体姿态进行匹配，使用的方法是孪生图卷积神经网络（如下图所示）。

如果没检测到人体，则认为是目标丢失。

作者发现这种简单扩大范围姿态估计，然后再进行姿态匹配的方法是行之有效的。如下图：

上图人物在镜头焦距突变的时候，虽然场景和人体表面特征变化比较大，但人体姿态变化并不大。

另外如果在关键帧人体检测中出现了新目标，也使用上述姿态匹配的方式进行人物个体关联，相当于行人重识别。

实验结果

作者在Posetrack 2017 Test set 与 Posetrack 2018 Validation Set 进行了实验。

结果如下：

可见，即使与目前精度最高的离线姿态跟踪算法（HRNet CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法）相比，LightTrack也取得了可匹敌的精度。

与在线计算的姿态跟踪算法PoseFlow、JointFlow比，则取得了大幅的精度提升，而且帧率也更高（使用Telsa P40 GPU，达到47/48 fps）。

值得一提的是，该框架不仅是一套完整的姿态跟踪算法，而且还允许用户非常容易地对该流程中的各个步骤进行替换、改进与评估，是该领域进一步研究的绝好工具！

下图为姿态跟踪的部分示例：

Real-Time Dense Surface Mapping and Tracking（论文）

每天好论文太多了,我决定开个标签来放论文.要是有侵权什么的,请踢我一脚,我赶紧删除. 先放目录因为我也没有找到一个合适的共享文件的方法,所以就先不放共享链接了. https://github.com ...
HCF：Hierarchical Convolutional Features for Visual Tracking

今天讲解的这个算法是比较简单容易理解的,这个前提就是你对相关滤波器算法和深度学习都有一定的了解.废话不多说,直接进入正题. 论文下载地址:http://pan.baidu.com/s/1hs84t9M ...
(2条消息) 六种人体姿态估计的深度学习模型和代码总结

姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测.姿态估计.分割等等.有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形.增强现实或者人机交互 ...
极市直播丨陈鑫：CVPR 2021-TransT: 基于Transformer的高性能单目标跟踪算法

一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过90位技术大咖嘉宾,并完成了78期极市线上直播分享.往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文 ...
基于RGB和深度数据的目标检测和姿态估计，用于实时、自适应机器人抓取

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
昆明理工大学杨博、王俊婷等：基于贪婪神经网络的集中式温差发电系统最大功率跟踪

点击下面标题,了解通知详情 2020第九届电工技术前沿问题学术论坛暨第十三届中国电工装备创新与发展论坛团队介绍杨博,英国利物浦大学博士(国家留学基金委公派全额资助),昆明理工大学副教授.硕士生导师 ...
最新综述：基于深度学习方式的单目物体姿态估计与跟踪

原文:Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview 作者:中国人民大学 ...
极市直播回放丨第76期-许鸿斌：AAAI'21杰出论文，一个解决三维重建对数据依赖的新框架（已开源）

多视图立体几何(Multi-view Stereo, MVS)是一种很经典的三维重建方法,旨在从多视角图像中恢复场景的三维信息.近年来,越来越多的工作开始将深度学习与传统的多视图立体几何方法结合,以提 ...
《2021食品行业消费新趋势洞察》发布：京东超市七大食品新赛道展现蓝海机遇

本文源自:中国网科技 5月13日,以"与食俱进,聚力前行"为主题的2021京东超市吃货嘉年华发布会上,<2021食品行业消费新趋势洞察>(以下简称"报告&qu ...
京东物流不是新顺丰

文丨老铁京东物流通过港交所聆讯即将在港上市,估值为350亿美元.从提交招股书至今,无论是公共舆论抑或是资本市场,都难免将其与顺丰进行对比,相当部分观点认为:京东物流乃是京东集团体内孵化的"顺 ...
全品类、一站式、数智化京东健康的进化新路径

来源:中新经纬中新经纬客户端5月14日电 2020年暴发的一场疫情,让人们在感叹生命脆弱的同时,也引发了人们对身体健康的高度重视.毕竟相较于任何看得见的物质享受和看不见的虚荣满足,如果健康出了问题, ...
投资者该以什么样的心态与姿态面对新事物-基金投顾？

在前面我们回答了机构和从业者可能关心的问题,具体包括: 基金投顾业务真的会在中国迎来大发展吗?它的发展有哪些核心要件?中国的客观环境与美国等海外市场,在业务具体的落地过程中会不会存在差异和不同? 那么 ...
以全力奋进的“赶考”姿态迈步新征程

"十四五"开局之年,我省首批全国文明城市.全国县域经济百强县(市)安宁市立定与强的比.与快的赛.与勇的争,在推进高质量发展中持续创新实践,阔步迈进全面建设社会主义现代化新征程.推进 ...
当我们看腻了5w之后，试试用这个新框架来梳理你的传播学体系

在班女士每周的辛勤劳作之下,大家应该已经有了一本比较详细的<传播学教程>每章节框架图. 这样就算掌握传播学了吗? 实话应该是,说「入门」都甚至有些勉强. ヅ
【重磅推荐】2021考前冲刺|新高考语文理解性默写（60篇）

新高考语文理解性默写(60篇) <论语>十二章 (1)在<<论语>十二章>中,孔子用反问语气强调人要有仁爱之心,否则遵守礼仪也没什么用的句子是:人而不仁,如礼何? ...
【案例挖掘机】家乐携李诞治愈人间，京东手机再开新脑洞

[案例挖掘机]项目,致力于以汪峰式的拷问深度剖析案例背后有趣的故事,大到年度规划的投放技巧,小到拍摄现场的蚊虫叮咬. 每周一次的精彩案例大放送如约而至,TOP君为大家精选本周(2021第15周,4月 ...

推荐！京东开源姿态跟踪新框架LightTrack！

相关推荐