完美抠图王冰冰！

2024-06-18 02:05:46

本文经AI新媒体量子位（ID：QbitAI）授权转载

鱼羊明敏发自凹非寺

看这一头蓬松的秀发，加上帅气的动作，你以为是在绿幕前拍大片？

No、No、No

这其实是AI拿来视频实时抠图后的效果。

没想到吧，实时视频抠图，现在能精细到每一根发丝。

换到alpha通道再看一眼，不用多说，德芙打钱吧（手动狗头）。

这就是来自字节跳动实习生小哥的最新研究：实时高分辨率视频抠图大法。

无需任何辅助输入，把视频丢给这个名为RVM的AI，它分分钟就能帮你把人像高精度抠出，将背景替换成可以任意二次加工的绿幕。

不信有这么丝滑？我们用线上Demo亲自尝试了一波。

相比之下，现在在线会议软件里的抠图，一旦头发遮住脸，人就会消失……

头发丝更是明显糊了。

难怪看得网友直言：

不敢想象你们把这只AI塞进手机里的样子。

目前，这篇论文已经入选WACV 2022。

你也可以上手一试

目前，RVM已经在GitHub上开源，并给出了两种试玩途径：

于是我们也赶紧上手试了试。

先来看看效果：

首先来点难度低的。

对于这种人物在画面中基本不移动的情况，RVM可以说是表现的非常好，和人工抠图几乎无差别。

现在，王冰冰进入动森都毫不违和了。

于是开脑洞，也变得简单了许多……

咳咳，言归正传。人物动作幅度加大会怎样呢？

对于多人舞蹈视频而言，RVM的表现也很nice。

即便动来动去、头发乱甩，也没有影响它的抠图效果。

只有在人物出现遮挡的情况下，才会出现瑕疵。

对比前辈方法MODNet，确实有不小的进步。

不过我们也发现，如果视频的背景较暗，就会影响RVM的发挥。

比如在这种背景光线昏暗的情况下，抠图的效果就非常不尽人意了。

可以看到，博主老哥的头发完全糊了。

而且身体的边界线也不够清晰。

所以，如果你想自己拍视频试玩，就一定要选择光线充足的场景。

利用时间信息

那么这样的“魔法”，具体又是如何实现的？

照例，我们先来扒一扒论文~

实际上，有关视频抠图的算法如今已不鲜见，其中大多数采用的是将视频中的每一帧作为独立图像来实现抠图的方法。

不同与此，在这篇论文中，研究人员构建了一个循环架构，利用上了视频的时间信息，在时间一致性和抠图质量上取得了明显改进。

从上图中可以看出，RVM的网络架构包括3个部分：

特征提取编码器，用来提取单帧特征；

循环解码器，用于汇总时间信息；

深度引导滤波（DGF）模块，用于高分辨率上采样。

其中，循环机制的引入使得AI能够在连续的视频流中自我学习，从而了解到哪些信息需要保留，哪些信息可以遗忘掉。

具体而言，循环解码器采用了多尺度ConvGRU来聚合时间信息。其定义如下：

在这个编码器-解码器网络中，AI会完成对高分辨率视频的下采样，然后再使用DGF对结果进行上采样。

除此之外，研究人员还提出了一种新的训练策略：同时使用抠图和语义分割目标数据集来训练网络。

这样做到好处在于：

首先，人像抠图与人像分割任务密切相关，AI必须学会从语义上理解场景，才能在定位人物主体方面具备鲁棒性。

其次，现有的大部分抠图数据集只提供真实的alpha通道和前景信息，所以必须对背景图像进行合成。但前景和背景的光照往往不同，这就影响了合成的效果。语义分割数据集的引入可以有效防止过拟合。

最后，语义分割数据集拥有更为丰富的训练数据。

经过这一番调教之后，RVM和前辈们比起来，有怎样的改进？

从效果对比中就可以明显感受到了：

另外，与MODNet相比，RVM更轻更快。

从下面这张表格中可以看出，在1080p视频上RVM的处理速度是最快的，在512×288上比BGMv2略慢，在4K视频上则比带FGF的MODNet慢一点。研究人员分析，这是因为RVM除了alpha通道外还预判了前景。

更直观的数据是，在英伟达GTX 1080Ti上，RVM能以76FPS的速度处理4K视频，以104FPS的速度处理HD视频。

一作字节跳动实习生

这篇论文是一作林山川在字节跳动实习期间完成的。

他本科、硕士均毕业于华盛顿大学，曾先后在Adobe、Facebook等大厂实习。

2021年3月-6月，林山川在字节跳动实习。8月刚刚入职微软。

事实上，林山川此前就曾凭借AI抠图大法拿下CVPR 2021最佳学生论文荣誉奖。

他以一作身份发表论文《Real-Time High-Resolution Background Matting》，提出了Background Matting V2方法。

这一方法能够以30FPS的速度处理4K视频，以60FPS的速度处理HD视频。

值得一提的是，Background Matting这一系列方法不止一次中了CVPR。此前，第一代Background Matting就被CVPR 2020收录。

两次论文的通讯作者都是华盛顿大学副教授Ira Kemelmacher-Shlizerman，她的研究方向为计算机视觉、计算机图形、AR/VR等。

此外，本次论文的二作为Linjie Yang，他是字节跳动的研究科学家。本科毕业于清华大学，在香港中文大学获得博士学位。

对了，除了能在Colab上试用之外，你也可以在网页版上实时感受一下这只AI的效果，地址拿好：

https://peterl1n.github.io/RobustVideoMatting/#/demo

GitHub地址：
https://github.com/PeterL1n/RobustVideoMatting
论文地址：
https://arxiv.org/abs/2108.11515
参考链接：
https://www.reddit.com/r/MachineLearning/comments/pdbpmg/r_robust_highresolution_video_matting_with/

(2条消息) 2020CVPR人体姿态估计论文盘点

Hey,今天总结盘点一下2020CVPR论文中涉及到人体姿态估计的论文.人体姿态估计分为2D(6篇)和3D(11篇)两大类. 2D 人体姿态估计 [1].UniPose: Unified Huma ...
CVPR2020 | 基于点的3D单阶段对象检测器3DSSD

论文原文:3DSSD: Point-based 3D Single Stage Object Detector 论文地址:https://www.aminer.cn/pub/5e54f1813a55a ...
1077篇！ICCV2019接收结果公布，你中了吗？（附7篇论文链接，含Oral）

ICCV2019接收论文id查看链接(或后台回复"ICCV2019"获取PDF): https://docs.google.com/document/d/1ip33oABDWYT9 ...
2张图片就能“算”出个视频，惊呆Reddit网友丨旷视＆北大

鱼羊萧箫发自凹非寺量子位报道 | 公众号 QbitAI 只给AI两张图片,就能得到高帧率动态视频? 输入的两张图像,重叠后是这样的: 而算出来的视频,是酱婶的: 不错,这又是视频插帧算法的功 ...
NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
CVPR 2021大赛，安全AI 之防御模型的「白盒对抗攻击」解析

CVPR 2021大赛，安全AI 之防御模型的「白盒对抗攻击」解析
90海归女生CVPR论文几近满分，可让机器识别视频人物的心智想法，即将追随导师朱松纯回国发展 | 专...

这几天,计算机视觉和模式识别领域的顶级会议 CVPR 2021(Computer Vision and Pattern Recognition)正在火热进行中,刚刚从加州大学洛杉矶分校(UCLA)博士 ...
刚刚，AMD开源了超分辨率技术：N卡也能用

机器之心报道编辑:泽南.小舟 FSR 将适用于 GTX 10 系列至今以来的所有显卡,是的你没看错,支持英伟达的显卡. 刚刚在台北 ComputeX 展会上,AMD 原本被认为日常走过场的主题演讲却 ...
完美抠图王冰冰！字节实习生开发的AI，实现4K60帧视频实时抠图，连头发丝都根根分明

看这一头蓬松的秀发,加上帅气的动作,你以为是在绿幕前拍大片? No.No.No 这其实是AI拿来视频实时抠图后的效果. 没想到吧,实时视频抠图,现在能精细到每一根发丝. 换到alpha通道再看一眼,不 ...
王冰冰李思思大玩冲浪！穿紧身泳衣身段完美，多次摔倒被水冲走

近日,官方在社交平台上公布一段视频,视频里央视主持天团在水池中模拟冲浪尽情狂欢,其穿着与身材引人注目. 画面中,撒贝宁.王冰冰一行人穿着专业的泳衣出现水池中,其中李思思和王冰冰尤为亮眼.李思思素颜出镜 ...
王加一陈婧霏新专辑首唱会完美落幕王加一个人新专辑巡演将开跑

2021年4月26日晚,有此山旗下唱作人王加一.陈婧霏的新专辑首唱会在北京糖果完美落幕.两位新锐唱作人首度现场演绎新专辑曲目,让现场的所有听众感受到他们最纯粹的音乐态度,交织在空气中变成全场的感动. ...
“央视最美女记者”王冰冰, 体验海上冲浪, 苗条身材实力抢镜!

阳阳解读关注2021-04-19 15:15原创一般提到女记者时,我们想到的都是很多女记者固有的刻板印象,特别是央视女记者,因为经常要出现在一些重要的场合,她们不仅穿着打扮特别严谨,在言行举止方面也一 ...
王冰冰之后，又有央视女记者火了，她们到底有多好看？

一个原本并不出名的央视记者,摇身一变成为迷倒全网的"顶流主持人",王冰冰甜进了大众的心扉. 而今年年初,又有一位新鲜出炉的央视小花,正在强势占据观众的视线. "威严庄重& ...
王冰冰之后，《山河令》张哲瀚被叫老婆？曾拒于正

帷幕再启的这个三月,又一位"国民老婆"火了.她,等等,是"他".他是来自<山河令>的主角,张哲瀚.曾拒于正.温馨提示:本文约1300字,阅读需要一分 ...
王冰冰模仿机器人拜年，揭秘真网红的背后，用实力证明自己

她令人过目成诵,被誉为国民初恋.国民女友."真网红",只因长相甜美,和一个回眸一笑,她就是王冰冰.近日,她模仿机器人拜年冲上热搜.温馨提示:本文约1300字,阅读需要一分钟左右. ...
王冰冰之后，庄晓莹开启爆红模式，聪明的人更需要努力

帷幕刚启的二月,又一位"国民初恋"女记者火了,她是来自央视的记者庄晓莹.温馨提示:本文约1000字,阅读需要一分钟左右. 为什么说庄晓莹开启爆红模式呢?因为,此前王冰冰和丁真都是这 ...
这位小美女高考生像央视美女主持人王冰冰？...

这位小美女高考生像央视美女主持人王冰冰?大家看看像不像? 内蒙古师大附中考点走出一位理科考生和央视美女主持人确有相像,呲牙一笑更相像. 女生面对媒体的采访,声音甜美,举止大方,言谈自然,笑容甜美.她称 ...

完美抠图王冰冰！

本文经AI新媒体量子位（ID：QbitAI）授权转载

鱼羊 明敏 发自 凹非寺

你也可以上手一试

利用时间信息

一作字节跳动实习生

相关推荐

鱼羊明敏发自凹非寺