2张图片就能“算”出个视频，惊呆Reddit网友丨旷视＆北大

2024-06-21 01:24:27

鱼羊萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

只给AI两张图片，就能得到高帧率动态视频？

输入的两张图像，重叠后是这样的：

而算出来的视频，是酱婶的：

不错，这又是视频插帧算法的功劳。

极限操作玩得6，让老电影变丝滑的常规手法，这个名叫RIFE的AI算法同样信手拈来。

右边这支经典探戈，看上去是不是比左边丝滑多了？

不仅是老电影，飞行表演的精彩瞬间，也能一口气从每秒24帧提升到每秒96帧。

这项新研究，来自旷视和北大。不仅能让老影像资料追上人民群众对高帧率的需求，支持2X/4X/8X高质量插值，它还有一个最大的特点：快。

量子位在Colab上用T4跑了一遍Demo，一个时长53秒的720p 25fps视频，插值到100fps仅用了2分19秒。

该项目现已开源，并且有官方Demo、第三方Windows应用可以试玩。

看过了RIFE的表现，网友们不由惊叹，这是要超越那只经常在各种修复视频里出现的插帧AI DAIN，引领一波新潮流的节奏啊？

一时之间，RIFE在Reddit上的热度飙升到了2.8k。

那么，这样的效果究竟是怎么实现的呢？

从双向估计，到一步预测中间帧

视频插帧，通常是用光流预测算法来预测中间帧，并插入两帧之间。光流，就像光的流动一样，是一种通过颜色来表示图像中目标移动方向的方式。

△稀疏光流与稠密光流

传统光流预测算法，通常根据前后两帧视频来预测中间的某一帧长啥样。

将预测完成的图像插进去后，视频看起来就会变得更丝滑。

以DAIN的算法为例，如果要预测t时刻的帧，就需要t时刻的前后两帧视频，通过光流预测算法来实现。

△DAIN的算法图

但是这一类的算法会产生一个缺点：在预测过程中，如果用前后两帧图像产生双向光流，用线性组合来估计中间流，预测出来的结果，在运动边界区域就会出现伪影。

这样的伪影，使得重建中间帧图像的效果不尽人意。

那么，如果换一种思路，直接先预测中间流呢？

相比于利用前一帧和后一帧进行两次估计，这里的IFNET （a Specialized and Efficient Intermediate Flow Network）算法，将直接采用线性运动假设，对中间帧进行一次估计。

效果也显而易见，相比于利用前后两帧的双向估计所产生的光流，利用IFNET估计出的光流效果非常清晰，而且几乎没有伪影。

利用这种方式重建图像，不仅光流边缘看得清楚，而且速度也更快。

论文提到，RIFE是首个基于光流的实时视频插帧方案。

由于中间帧预测，直接假设了前后两帧的变换是线性的，相当于每帧预测中直接少了一次估计。

那么，这个模型，究竟将插帧算法提升到了怎么样的水平？

运行速度远超其他方法

前文已经提到，RIFE最亮眼的一点是快。

研究人员在UCF101、Vimeo90K、Middlebury OTHER set和HD benchmarks等基准上，将RIFE与英伟达的SoftSplat、上交大的DAIN等「前辈」进行了对比。

用来测试运行时间的是一个640×480的视频，使用的GPU型号是NVIDIA TITAN X（Pascal）。

从结果可以看出，在性能相当的情况下，RIFE基础模型的运行速度超过了所有对比方法。

而模型的大版本RIFE-Large，在性能超越SOTA方法SoftSplat的情况下，运行速度快出了30%。

另外，研究人员基于Vimeo90K测试集，提供了可视化的对比结果。

可以看到绿框部分，SepConv-L1和DAIN产生了伪影，而CAIN铲子部分则出现了缺失，相对而言，RIFE生成的结果更为可靠。

安装包和colab都有，试玩无忧

效果这么美丽的模型，应该怎么使用？

目前作者们已经给出了预训练模型的几种用法，从GitHub项目中可以直接下载网盘版的压缩包。

无论是用作者提供的demo、还是用你自己想要进行插帧的样本，都可以上手试玩。

当然，模型也有colab版本，可以直接在云服务器上玩模型。

而且，已经有玩家做出了Windows版的软件，可以直接下载下来使用。界面看起来还挺简洁：

模型RIFE的出现，已经让一些游戏爱好者狂热了起来：

你们能想象吗，就算是已经吃灰很久的PS2，也可以达到4k游戏的水平效果了！利用这种算法，3步就能搞定！

不过，也有网友表示了对这种算法的担忧。

虽然这种算法速度快、性能高，但实际上存在一个问题：

这种算法，本质上无法联想到丢失的帧间信息，所以无法用在安防视频上。

对于这些方面的应用，未来还需要进一步考虑。

作者介绍

黄哲威，论文一作，目前是旷视的一名算法研究员，毕业于北京大学。

进入北大信科一年后，他获得了ICPC区域赛金牌，还成为了旷视科技智能计算组（IC组）的实习生，之后参加了NIPS 2017的Learning to Run比赛，使用Actor-Critic Ensemble算法获得了第二名。此外，在ICCV 2019顶会上，他的论文同样被收录。

张天远，毕业于北京大学，就读期间，论文曾经被ICML 2019、ICCV 2019、NIPS 2019等顶会收录。

衡稳，于北京大学获计算机应用技术硕士学位。

施柏鑫，来自北京大学，目前是北京大学信息科学技术学院的助理教授（博雅青年学者）、研究员、博士生导师。

周舒畅，旷视研究院AI计算组组长，本科毕业于清华电子系，博士毕业于中科院计算所，曾获NeuIPS 2017 Learning to Run Challenge第二名，美国国家标准技术研究所NIST TRAIT 2016 OCR冠军。

项目地址：
https://rife-vfi.github.io/

论文地址：
https://arxiv.org/abs/2011.06294

与DAIN效果对比：
https://www.youtube.com/watch?v=60DX2T3zyVo&feature=youtu.be

参考链接：
https://www.reddit.com/r/linux/comments/jy4jjl/opensourced_realtime_video_frame_interpolation/
https://www.reddit.com/r/MachineLearning/comments/jyvog1/d_better_than_dain_increase_videos_fps_with_rife/
http://hzwer.com/
http://tianyuanzhang.com/
https://eecs.pku.edu.cn/info/1339/9244.htm
https://www.linkedin.com/in/heng-wen-020321a0/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

还原百年前的世界，AI 大牛将 1895 年老电影转换为 4K 高清！

<火车到站>是电影史上最著名的电影之一.该片由法国导演奥古斯特和路易·卢米埃拍摄,在当时达到了前所未有的质量水平. 今天,卢米埃尔兄弟的杰作看起来充满颗粒状,浑浊,破旧.但一个名叫 Den ...
亚马逊推出量子线路噪声模拟器，用于模拟有噪声的量子线路

Amazon Braket现在提供完全托管的密度矩阵模拟器DM1,以用于模拟有噪声的量子线路. 借助DM1,用户可以调查真实噪声对量子算法的影响,从而为错误缓释策略提供所需的信息,从目前的量子计算 ...
缅甸又有男星“被死亡”，哭笑不得发视频证明还活着

[缅甸中文网讯]日前,缅甸社交网络上盛传男演员Dain Daung去世的消息,甚至还有疑似Dain Daung躺在棺材里的照片. 消息刚传出时,很多人信以为真,不知情粉丝纷纷哀悼,Dain Daung ...
【第二期】20篇强化学习论文总结（附下载链接）

前段时间,我们为大家整理了105篇强化学习论文的综述及列表(点击获取). 为了方便大家学习,我们将会出5期强化学习的论文总结,每期会有20篇左右的论文,在每周一发布,敬请关注. 目前已出了[第一期]2 ...
对今日头条评论功能的小调研和几点思考

对今日头条评论功能的小调研和几点思考
领导是否真心要提拔你？听懂这3句话就够了，算出你的职场身价

道吾好者是吾贼,道吾恶者是吾师.择其善者而从之,其不善者而改之.职场上,领导是你的上位者,有时候他说你好话,是要用你但不给你利益,用好言好语.和眉善目来敷衍你:有时候他批评你,反而是想提拔你,是在考验 ...
怎样准确简单算出每年的干支纪年的方法，很好玩，学会教给孩子

怎样准确简单算出每年的干支纪年的方法，很好玩，学会教给孩子
如果算命算出自己是好命，是否什么也不用干了就能发财？

泽海命理风水从事算命几十载,谈下自己的观点.一个命格很好的人,就是成格局的人.这样的人,不可能会好吃懒做.因为他会被向上的气运推着前行.这就好比你开着一辆劳斯莱斯,奔驰在宽阔的高速路上,你被它的稳定性 ...
武器发生炸膛有多恐怖？这6张图片就能给出答案

枪支炸膛大家都听说过吧?炸膛顾名思义,炸的是枪机和枪管,炸膛是一种非常严重的枪械事故,它有可能危及到射手的生命安全.那为什么会发生炸膛呢? 枪支炸膛大致分为三种:第一种,可能是射手使用了非常劣质的弹药 ...
资深法官：1分钟算出人身损害赔偿金额，《全自动EXCEL计算表》

来源:法务之家:作者:李杰民,河北省馆陶县法院 <人身损害赔偿计算器> 欲善其事,先利其器.今天想分享的这份自动计算人身损害赔偿数额的<人身损害赔偿计算器>,是我抱着极大的兴趣 ...
给你任意一年，你能算出是农历哪年吗？

公历年尾数减3,便是天干,如2021尾数1减3不够用,就向前一位借,就是11减3,得8,甲1乙2丙3---第八位就是地支辛. 公历2000年后的最后两位尾数加5除12,就是地支,如:2021年,21加 ...
一个公式，算出你离尿毒症还有多少年

一位慢性肾脏病患者,是否会进展到尿毒症?影响因素有多种,包括尿蛋白.肾小球滤过率.年龄.血压.血红蛋白.性别,以及病理上的细胞增生.纤维化等. 比如尿蛋白,对肾脏的影响很大,但是,具体有多大? 我们需 ...
盲人算命时如何算出万年历的

盲人算命时如何算出万年历的?有什么口诀? <银盘子>的秘密万年历是一种将公历.农历.干支历相互对应,编排在一起的历学工具书.查用万年历,主要是使用年历中的干支纪时. 干支纪时是我国独创的 ...
男子占卜算出自己死期，到了那天却没死，最终选择自杀结束了生命

要说起"能掐会算"的神人,我国古代历史中还真是比比皆是,姜子牙.诸葛亮就是最具代表性的人物. 他们不仅能呼风唤雨,还能"逆天改命",尤其是诸葛亮在预料到自己死期 ...