从 UGC 到 AIGC:穿越历史周期,做时间的朋友
rct studio©
本文来自微信公众号:rct AI(ID:rct-ai),作者:rct AI
Somewhere I have never travelled, gladly beyond any experience, your eyes have their silence.——E.E.Cummings
在 AI 理解下,根据上述诗句所生成的图景
从内容的本质出发:望向内容生产和消费
内容 = 信息 + 载体
从文章、音乐、到视频甚至是游戏 ,每天大量的内容都被产出和消费。五彩斑斓的内容世界似乎已经让人习以为常,但我们却很少去思考,这些内容的本质是什么,它们又是被谁、怎样地生产出来的。
要剖析内容本质,不妨从日常消费内容的过程看起。
生活中,当我们听到《菊次郎的夏天》而感到愉悦、看到复仇者们集结而感到振奋、操控英雄斩下五杀而感到刺激时,我们其实都是在用我们的感官不断地接收信息,并通过大脑处理这些信息,进而发出反馈。
可以说,消费内容就是一个接收并反馈特定信息的过程。
但信息却不能和内容划等号。对信息的定义有很多,哲学上认为“信息是事物运动的状态及其改变方式”。信息本身即随事物运动而产生,其存在并不依赖于信息的传播方式、路径和对象。也就是说,当我们从真实世界获取信息时,我们仅仅是通过某种合理的方式,获取了原本就存在的信息。
在获取、传递与接收信息的过程中,为了提高信息获取的效率,我们使用了各种载体。语言是一种虚拟的载体,文字是一种虚拟的载体,工具是一种实体的载体,物体是一种实体的载体。
试想一下,如果没有载体,信息无法传播,我们要想获得信息,只能直面事物运动,运用自己的感官来直接获取信息。
当信息拥有了载体,信息形态就发生了改变。载体让信息变得有序、稳定而易于传播。信息在载体中,如同物品被打包进了快递箱,能够被发送给不同的人和不同的地方。
然而,同样的信息,可以被打包进一个小盒子(如文字);也可以被打包进大礼盒(如视频)。不同的打包方式,让接收者们在解码信息(拆快递时)也有了不同的感受和理解。可以说,对于接收者而言,信息和载体的组合才是一个完整的可感知对象,是一个不同于信息本身的新事物。
这个新事物就是内容,信息有了载体就成为了内容。内容 = 信息 + 载体。
内容的生产与消费
上文提到,内容等于信息加载体,但这是否意味着内容的生产也如同这条等式般简单?
字面上,生产内容只需要将信息放入载体中即可。然而,谁来完成“放”这个动作、怎么放、放到什么载体,却比想象中复杂。
信息自然是不会自己跑到载体中的,是人将信息与载体结合。在这一结合过程中,人起到了中介的作用:人先利用自己的感官直面事物运动,接收第一手信息;这些信息经过人脑处理后,又转化为了人脑认知下的第二手信息;紧接着人将这些被大脑处理过的信息与选定的载体结合,成为内容并传达出去。
显然,人脑“对信息的处理加工”和“对载体的选择”在内容的生产中扮演了重要角色。人脑甚至能自我感知自己内部电讯号运动产生的信息,处理这些自己产生的信息并通过载体传达出去。
正是因为内容生产过程中需要有人脑的处理和人的参与,才让内容不只是信息的简单复刻,而产生了缤纷多彩的内容世界。
这就引申出了另一个问题,不同的人在面对同一信息时很有可能会以不同的方式处理,不仅处理的结果不同,最后选择的载体也可能不同。
梵高《向日葵》
因此,不同的人生产出来的内容质量自然也参差不齐。面对同一棵绽放的向日葵,有的人会用文字作为载体写“这向日葵真美”,而梵高则通过油画把向日葵的绚烂还原。
审美是一件主观的事情,劣质的内容也许也会有人买单,但毫无疑问,优质的内容才更受欢迎,人们也更乐意消费优质的内容。
那么我们又是如何消费内容的?这个问题在剖析内容本质时其实已经大致解答过:当我们在消费内容时,其实是在用我们的感官透过载体接收信息,并通过大脑解码这些信息,进而作出反馈。
可以说,消费内容就是一个接收、解码并反馈特定信息的过程。
相比生产内容,消费内容的过程要简单多了。由于信息本身已经经过一次人脑处理并被打包进载体中,已经变得相对易于被人脑理解,内容消费者只需要像拆快递那样,顺着内容呈现出的模样层层解码,就能完成消费。
但这也带来了另一重困境:内容生产比内容消费更困难,优质且受欢迎的内容生产速度更慢、数量更少,内容的生产很容易就无法满足消费的需求。
因此,如何扩大内容生产的规模,提高内容生产的质量与效率,是我们需要去探讨的。
让用户创造内容:释放内容生产力
从内容消费者到生产者:身份的转换
扩大内容生产规模,提高内容生产质量和效率,都是在供给侧作文章,归根结底是想让内容生产满足内容消费的需求。
过去我们在探讨生产与消费两者的关系时,时常以二元对立的角度将两者分割。但实际上,两者之间的界限却并非一直如此清晰,消费者群体也可能参与到生产中,生产出能满足需求的产品。
未来学家阿尔文·托夫勒就曾在其著作《第三次浪潮》提出“产消合一者”(prosumer)的趋势,即产品的消费者本身也是产品的生产者。在他的观点中,随着原本工业化大规模生产的产品已经满足了人们基本的消费需求,人们对产品个性化、客制化的需求越来越高;而这些个性化的需求需要消费者参与到物质生产的过程中。
一个典型例子就是戴尔电脑的生产,消费者可以在购买前选择自己喜欢的的电脑外观、配置等,将需求发送给戴尔,再由戴尔完成组装。
产品的生产与消费是如此,内容的生产与消费也是如此。
早在上世纪 60 年代末,嬉皮士运动中就诞生了一本由它的读者贡献主要内容的著名期刊《全球概览》。当时排版技术的简化使得普通人也能制作版式精美的期刊,其创办者斯图尔特·布兰德的本意是为当时组建公社的嬉皮士们提供一本涵盖方方面面生活知识的概览。
在期刊发布后,不断有读者过写信、邮寄资料的方式向布兰德投稿。随着时间的推移,当《全球概览》发布到第二、第三版时,书中的内容已经大量由读者、DIY 爱好者们提供。可以说,《全球概览》的内容正是由其消费者生产的。
The Last Whole Earth Catalog
而到了 1980 年代,随着桌面排版技术的成熟,出版刊物进一步简单化,具有自主定制意识的消费者们也能出版各种类型的兴趣杂志,供具有类似兴趣的爱好者们消费。
技术的进步提高了内容消费者们产出内容的能力,而后来互联网的兴起更是让内容消费者生产、分发内容的门槛大大降低。
在这样的背景下,由于消费者的基数远比已有内容生产者庞大,让大量的内容消费者参与到内容生产中,毫无疑问能大大释放内容生产力。
与此同时,消费者们本身作为内容的使用对象,理论上最了解自己群体内对于内容的特殊需求,将内容生产的环节交给消费者,能最大程度地满足内容个性化的需求。
因此,让用户来创造内容(user-generated content)成了“扩大内容生产规模,提高内容生产质量和效率”的一大实现途径。
UGC 的井喷:技术驱动进化
正如上文所说,UGC 伴随着互联网的兴起而成为内容生产的主流模式。在互联网年代初期,具备 UGC 特征的数字内容就已经诞生并传播。一个经典的例子就是经典第一人称射击游戏毁灭战士(Doom),针对这款游戏,玩家自发地创作了大量可玩性极高的 MOD。
为了传播这些 MOD,玩家组建了早期的玩家社区交流,MOD 的流行在当时甚至带动了互联网的流行。
游戏《DOOM》
但除了游戏领域,互联网其他领域的 UGC 却相对沉寂。由于带宽、软硬件条件的限制,当时大多数网站都只起到展示信息的作用,用户只能阅读信息,而很难在公众平台分享信息。这一段“只读”时代也被称为“Web 1.0”时代。
但在 Web 1.0 时代中,却仍有一些试验田在试验 UGC 内容的魔力。比如当时门户网站中,每条新闻报道下面都存在评论系统。用户可以在阅读完新闻后,在评论区发表自己观点或评论他人的观点。这些 UGC 内容很好地增加了当时用户在阅览新闻时的乐趣和活跃度。用户创造内容带来的好处已露尖角。
时间来到 2000 年后,互联网在泡沫破裂后迎来了更稳健高速的发展,UGC 也迎来了第一波井喷。在这段被称为 Web 2.0 的时代里,博客、维基百科、YouTube、Facebook 等平台的涌现为用户创造内容提供了简易的工具和分享平台。
这也直接推动 UGC 成为了互联网数字内容的重要源头之一,同时,用户对数字内容的主要消费对象也从门户时代的 PGC,逐渐转向了以 PGC 和 UGC 混合体。
内容生成的四个阶段
而 2010 年之后的移动互联网时代,UGC 更是愈发成为数字内容的主流。微博的兴起降低了用户表达文字的门槛;智能手机的普及让更多普通人也能创作图片、视频等数字内容,并分享到短视频平台上;而移动网络的进一步提速,更是让普通人也能进行实时直播。
UGC 内容不仅数量庞大,而且种类、形式也越来越繁多,推荐算法的应用更是让消费者迅速找到满足自己个性化需求的 UGC 内容。
纵观 UGC 的发展历程,技术依旧起着推动作用。未来,随着互联网和各类硬件、技术的进步,UGC 内容还将会在数量、形式、可交互性等方面进一步突破。
解剖 UGC:内容生产去向何处
和传统的内容生产方式:大规模专业创意团队生产内容(PGC)不同,用户创造内容(UGC)是由内容的消费者/使用者主导的,呈现出不一样的特征。对于用户创造内容,世界经合组织(OECD)曾在 2008 年给出过官方定义,这一定义并不明晰,但我们可以通过分析这一定义认识 UGC。
定义中首先提到 UGC 以网络出版为前提。换句话说,即用户创造的内容可以在公开的数字平台被公众传播、获取与消费的,这其实是在强调 UGC 的开放性。若用户创造的内容只能在自己的私人社交网络中传播,而不能被更多的用户消费,则不能被称为 UGC。
定义还要求用户创造内容需要具有创新性。若以定义原文的字面意思理解,很容易对这里的“创新性”产生疑惑,因为一个事物是否创新,是很难界定的;但若将创新拆解为,生产了新的内容/增添了新的元素,就很好理解了:
用户创造内容需要从零原创或在已有内容的基础上添加出新的元素,而不是无效复制已有的内容。
最后,OECD 认为 UGC 是由非专业人员或权威机构创作的。但实际上,内容创作者是否专业同样是很难界定的。
某些用户在经过初始阶段的非专业创作后转变为了专业人员;而一些专业人员也可能在业余时间创作并分享内容。因此,对于 UGC 创作的主体,大可不必限定于专业与否,重要的是创作或分享的手段需要是非专业的。如专业的作曲家在专业的录音棚创作了歌曲,但却在非专业的平台分享了这首歌曲,这同样能被视为 UGC。
因此,从以上对官方定义的分析,我们能提炼出 UGC 的三个特征:
一是用户创造的内容可以在公开的数字平台被公众传播、获取与消费。
二是需要从零原创或在已有内容的基础上添加出新的元素,而不是无效复制已有内容。
三是运用非专业的手段创作或分享内容。
这三个特征背后的生产主体都是数字内容的用户。但实际上,无论 PGC 还是 UGC,内容生产的主体依然都是人类,只不过以不同的身份出现在生产活动中。
内容生产力的不足也许暂时通过模糊内容生产和消费的边界、释放“消费者”这一身份下的生产力得到了缓解,但人脑的知识图谱终究是有限的,当内容生产者和消费者的生产潜力都被消耗殆尽,内容消费需求的缺口又能由什么来填补?
AIGC 的崛起:从学习到超越经验
在这个部分,我们没有选择特定的内容载体例如文字、图片或视频,去探讨 AI 在内容上的创作,因为这种场景化的探讨会让我们走向技术细节发展的争论之中,所以我们希望从更宏观的维度来对 AIGC 进行讨论。
事实上,随着 AI 技术的发展与完善,其丰富的知识图谱、自生成以及涌现性的特征,会在内容的创作为人类带来前所未有的帮助,具体表现在能够帮助人类提高内容生产的效率,丰富内容生产的多样性以及提供更加动态且可交互的内容,从而在这个基础上来弥补数字世界内容消耗与供给的缺口。
我们可以设想,在面对同一个信息时,人类会从自己大脑所构建好的知识图谱中选择一个方向对信息进行处理与应用,但机器则能够从其更庞大且多维度的知识体系当中给出不同角度的解读,从而给内容创造者提供更多的创作思路,提升创作效率的同时进一步丰富内容的多样性。
另外,其自生成以及涌现性的特征,能够突破规则与约束,为体验者更加动态且多样的内容。但这个过程是需要 AI 逐渐积累与发展的。
在上文的讨论中,我们提到内容是由信息与载体构成的,人类在对信息进行处理、加工、结构化、使用,以及对载体的选择过程就是内容的创造过程。
当然这个过程也不是人类天生就具备的能力,而是在后天的学习中不断积累的。
这并不是如文字所描述的一个简单过程,而是一个涉及多维度的复杂过程:首先人类大脑需要具备对外界信息的接收与处理能力,以及在后天的学习过程中积累对信息结构化的能力,然后逐渐构成自我的知识体系,进一步形成符合自己能力特征的知识图谱,从而创造出想象当中的内容。
基于这样简单的对内容创作的描述,我们是否可以假设:若机器具备对信息处理、结构化以及使用的能力,同时忽略对具体的载体形式选择,那么机器就具备了创造内容的能力呢?
继续依据该假设,我们可以看到这里的关键在于如何去理解人类和机器对信息处理上的不同。
在 The Book of Why: The New Science of Cause and Effect 一书中,Judea Pearl 描述了因果律的三阶段梯论,事实上我们也可以从认知的角度来重新理解这三个过程,体会人类与机器在获得对外界认知上的不同:
第一个阶段:对外界环境进行观察,在观察中寻找规律。例如,计算机研究了数百万量级的围棋对战数据后,就能够找出哪些对战的策略会导致更高的胜率。但这个阶段计算机只是被动的接受数据,并且只是停留在统计意义上对相关性的理解,无法超越已有的经验。
第二个阶段:对外界环境进行干预,在改变中寻找规律。例如,若改变现有围棋对战中的执行策略,让机器去进一步判断能否取得胜利,在这个阶段就需要 AI 主动的创造数据,逐渐超越已有的经验,
第三个阶段:在想象中对外界环境进行干预,在反事实中寻找规律。例如,让机器在对战中去想象如果执行这一步会怎么样,在“大脑”中学会构造还没有发生的事情,在这个阶段 AI 就逐渐具备了想象的能力。
The Book of Why: The New Science of Cause and Effect
人类之所以能够超越观察,是因为我们拥有一颗擅长分析因果关系的大脑,从而能够达到干预以及想象的阶段。
而对于 AI 来说,也许当前还处于第一或第二阶段,所以一些信息的复杂度机器还没有办法处理,人类需要将其简化之后再投喂给机器,让机器进行处理。
所以我们需要帮助机器构建对信息的理解,逐渐实现从第一、第二阶段到第三阶段的跨越,同时在这个过程中积累出跨领域的知识图谱,直到实现最终机器也能够创造多样的内容。
写在最后
“歌舞伎演员市川染五郎是第一次参加电影制作,也是第一次为主人公配音。除了歌舞伎之外,他没有其他表演经验,动画只能靠声音来表现,要比舞台上演戏说台词夸张一些,他很为难。”
“而杉咲花表示,动画里有些平时不会出声的地方也要发声,这一点确实很难。”
虽然我们都认同 AIGC 对于信息生产的膨胀性扩大意义,但我们也都清楚,这很难。需要计算机、数学、心理学、社会学、哲学……众多学科交叉进步,共同作用,人类才能跨越下一个工业生产的台阶。
我们仍在不断的探索与努力。
设想在一个虚拟世界当中,每一个 NPC 都是智能体的形式存在,这些智能体不但能够识别所处环境状态的改变,还能够根据每一次环境状态的改变调整自己的行为策略,做出符合其性格特征的行为。
无论在任何场景中,每一次玩家与智能体的交互,智能体都能够根据玩家状态、环境状态以及自身状态等参数做出相应的行为,进而与玩家在交互过程中产生涌现式的动态内容。
所以在某种意义上,该智能体也就也就具备了对信息的识别、处理以及使用的能力,从而在虚拟世界的环境当中,不断地生产出可交互的内容。
当一个玩家对“她”说:“hi~早上好呀”
“她”抬起头如往常一样回复说:“早上好,需要为您开启前往学校的跳转链接吗?”
这样画面足以令 2021 年的人热泪盈眶。
身处于这样一个世界当中,当你已经适应、融洽了这个世界之后。在某个夏日午后,在某个瞬间里,远处虚拟的云彩缓缓流淌、耳边蝉鸣缠绵似一般。
这一瞬间你愣了愣,然后脱口而出:
“是啊,情节如苏打般涌现。”
Reference:
赵宇翔,范哲,朱庆华.用户生成内容(UGC)概念解析及研究进展[J].中国图书馆学报,2012(5):68-81.
Pearl J, Mackenzie D. The book of why: the new science of cause and effect[M]. Basic books, 2018.
本文来自微信公众号:rct AI(ID:rct-ai),作者:rct AI