百度全民小视频“一键动漫”背后:AI成短视频赛道关键力量
这两天,朋友圈忽然刮起了一股“二次元”风,各种动漫小视频频频亮相,朋友圈玩得不亦乐乎。起初我并没有太在意,毕竟无论是抖音的大头娃娃动漫特效,还是快手的动漫脸,虽然有趣但稍显呆板。但后来发现,这次的动漫效果似乎不一样,不仅能够1:1生成二次元虚拟人像效果,并且一颦一笑之间惟妙惟肖,卡通化视频也很流畅。
一查之下,发现这是百度旗下小视频平台全民小视频新上线的“一键动漫”新功能,它能通过人像理解和图像生成等AI技术,为用户量身定制千人千面的二次元虚拟形象。并且,这一功能已经在业内引发热议。
业内关注的焦点主要集中在两方面,一方面是在内容上,在短视频内容同质化严重的当下,全民小视频支持为用户量身定制千人千面的二次元虚拟形象,便于帮助创作者打破内容同质化的顽疾,带来更多个性化和多元化的内容;另一方面则是在技术上,该技术的出现,意味着短视频平台的比拼,正由局部AI竞争升级到全面AI竞争新阶段,短视频行业进入AI决胜时刻。
那么在各大短视频平台斗法的背后,AI技术是如何为短视频赋能的,在当下发挥的作用又有何不同?在具体的实战中,检验AI技术赋能短视频的实战标准是什么?而在如今的主流短视频平台中,到底哪家的技术更强?
从局部战争到全面战争,AI赋能内容创作成“核武器”
AI技术与短视频的结合由来已久,纵观当下主流的短视频平台,不管是百度系和腾讯系,还是抖音和快手,都拥有很强的AI能力,百度的AI综合能力就不用多说了,无疑是当中最强的,而抖音和快手也都曾自称是一家AI公司。具体到AI技术与短视频的结合上,可以说短视频从内容创作、内容理解、内容审核和推送等整个环节都离不开AI技术支持。
比如在内容质量相差不大的前提下,为什么有些平台推送的视频让人沉醉不可自拔,越看越想看,而有些平台推送的视频,刷几条就不想再看了,这背后就涉及到AI技术对视频内容理解、用户理解以及将内容和用户进行匹配等方面较量;再比如短视频平台上诸如染发特效、背景替换、美妆特效各种特效设计也会用到像头发分割、背景分割以及人脸关键点等AI技术。
不过在短视频内容同质化加重的当下,各大平台对AI技术运用的重点开始由幕后上升到台前,如果说以前AI技术更多是用在内容理解和分发层面,那么现在则更侧重内容创作层面,短视频AI战争也从局部战争进入到全面战争。
全民小视频在最近上线“一键动漫”功能就是最好的佐证,这项AI技术能够在还原用户个性化特征的基础上,一键生成流畅自然的卡通化视频,为行业开了一个好头,让普通用户也能轻松拥有专属化个性动漫视频,实现了以往不能实现的创作,这就是AI技术的力量。
(全民小视频“一键动漫”效果)
事实上,不止是全民小视频在做这件事,通过快手旗下的一甜相机也能生成“图片版动漫”,通过抖音的风格化滤镜也能实现“动漫脸”的效果,只不过技术上不同而已。全民小视频是实现视频化动漫内容创作,将人物变成动漫形象;而后两者则是图片化动漫内容创作,在人物上面覆盖了一张动漫图片,技术上不可同日而语。
虽然平台技术各有差异,但毫无疑问,在短视频下半场亟需破除内容同质化的大环境下,利用AI技术赋能短视频内容创作将进入白热化状态,而AI技术的比拼或成为影响平台后续竞争的胜负手。
“真AI”还是“假AI”?短视频AI技术实战的三大标准
既然在短视频下半场,AI技术对平台影响日趋加重,那么到底什么样的AI技术能给平台带来更大的加成呢?这需要在实战中检验,具体来看主要有以下三大标准:
1、技术呈现上,既要“量变”更要“质变”
各大短视频平台利用AI技术让内容更美更有趣一般有两种情况,一种我们称之为“量变”,即在人物本身基础上进行小修小补,内容有了美化但本质没变。比如通过瘦脸美白,让大脸用户人脸变小,让皮肤黑的用户皮肤变白,从而让视频视觉效果更加出众;再比如挂上各种有趣的滤镜,让内容更加生动。
另一种则是像全民小视频“一键动漫”这种,将视频中人物进行1:1二次元虚拟化,生成千人千面的虚拟人像,让原人物退居幕后,给用户呈现完全不同的二次元虚拟人像,这种可以称之为“质变”,两相比较,真正的AI在技术呈现上,自然既要支持“量变”,更要支持“质变”。
2、内容打造上,既要比“通用性”更要比“个性”
而AI技术在内容打造上,不仅要有通用性的美,更要有个性化的美,不是要打造千变一律“网红脸”,而是要打造“个性脸”。使用过抖音的用户都知道,一旦看过使用某热门特效的视频后,就有大概率再出现相同特效的内容,这种内容打造和推送在前期很受用户喜欢,但时间一长便容易陷入“信息茧房”,让用户产生“审美疲劳”。
相比较而言,快手则要相对克制一些,这样虽然前期发力不如抖音,但保留了社区的多元化,后劲会更足一点。但如果不从AI技术打造内容层面进行突破,产生更多“质变”的内容,也只是治标不治本,百度显然也注意到了这点,因此试图在内容上做突破,全民小视频的“一键动漫“功能就是破除内容同质化的一个好方向。
3、用户感知上,既要“功能到位”更要“体验到位”
值得一提的是,虽然AI技术赋能短视频带来了众多实在的收益,但也不乏有平台以AI不是噱头,看似为平台增加了众多炫酷的功能,但在实际体验上却吸引不了用户,原因就是体验不佳。
以动漫特效为例,这是一项非常受欢迎的玩法,一来有趣,二来也为那些不愿露脸的用户提供了方便,因此主流短视频平台都有类似应用,不过各平台带来的用户体验是不同的,比如快手上也有一秒变动漫人物的特效,但特效结果是生成一张动漫图片,而全民小视频上则是生成一段动漫视频,从体验上来看无疑后者更胜一筹。
看起来,AI技术家家都有,但只有支持“质变创作”,能打造个性化内容,在功能上和体验上都让用户称赞的才能称为“真AI”。
由表及里,看短视频AI战争的本源之力
抛开具体应用不谈,回归技术本身,当短视频进入到AI决胜时刻,短视频巨头们在AI技术上较量,主要还体现在以下两方面:
首先是图像处理技术。当下短视频用户不是陷入“视觉疲劳”了么?那怎样才能创造让人眼前一亮的内容呢?通过平台补贴扶持,从人力角度是一条路,不过平台补贴时间有限,受众有限,并且没有太高的行业壁垒,而通过提升图像处理技术,让普罗大众都能参与创作更优质的内容,显然没有人力扶持上的不足,显得棋高一着。
而在图像处理技术的背后往往是一个平台实力的比拼。以这次全民小视频上线的“一键动漫”为例,其背后需要人脸关键点、人脸融合、人像分割,头发分割、人体关键,以及多种平滑技术等作为支撑,才能让二次元虚拟形象成功地“动”起来,无论是眨眼、说话等小动作,还是转身、走动等大动作都能还原人物个性特征,在业界首屈一指,可见其技术功底之强。
再比如百度旗下的好看视频,其借助百度智能视频平台,能实现黑边自动检测和裁剪、扩大可观看区域、添加高斯模糊效果、边缘锐化与增强等智能优化提升视频物理质量。
其次是视频分发和匹配技术。如果说图像处理技术的升级能提升内容整体质量,那还需要将优质的内容以合适的方式推送给合适的用户,才能让用户体验提升。这不仅要求能读懂内容,读懂用户,还要求在诸如高点击率时,视频高速切换下也能提供流畅的画面。
以读懂用户为例,百度、抖音、快手等短视频平台都是基于与用户的互动积累,对用户进行精准刻画,因此平台越大与用户互动积累越多,在这方面表现就会更加突出。以百度为例,基于与用户19年的深度交流,百度为全国数亿用户做了200多万维度的精细刻画,可提供包含亿级别节点、千亿级别属性和关系的知识图谱,能够很好地读懂用户。
而如何读懂内容,也很比拼各大平台的实力。比如快手会利用AI技术从感知和推理两个阶段来解读一个视频,通过感知视频中的人脸、性别、表情、颜值等来理解视频内容,而全民小视频通过百度云VCS视频内容分析系统,从智能分类、智能标签、语音技术、图像技术和NLP技术等多维度来理解视频内容,能够更好读懂视频内容。
可见,不管是在图形处理技术上,还是视频分发和匹配技术方面,作为全球AI巨头之一的百度,与业内主流短视频平台相比更有优势,而这或在短视频下半场成为百度短视频爆发的“核动力”。
如今,短视频AI全面战争已经打响,未来的短视频,将是得AI者得天下!AI实力雄厚的百度短视频或许也将迎来新一轮的“大爆发”。
*此内容为【智能相对论】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
完
智能相对论(id:aixdlun)
·AI新媒体;
·今日头条青云计划获奖者TOP10;
·澎湃新闻科技榜单月度top5;
·文章长期“霸占”钛媒体热门文章排行榜TOP10;
·著有《人工智能 十万个为什么》
·【重点关注领域】智能驾驶、AI+医疗、机器人、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。