机器洗稿之害,远甚于抄袭——首例洗稿侵权案评述

十天之后,郭敬明就当年小说《梦里花落知多少》抄袭庄羽的作品《圈里圈外》一事在微博上道歉,再度引发热议。

出现这样的事件,充分说明文化领域对抄袭行为的忍耐已经到达极限,原创和抄袭之间已经势如水火。

巧合的是,就在郭敬明道歉的同一时间,笔者代理的国内首例平台诉“洗稿”软件不正当竞争纠纷案也拿到了一审胜诉判决,法院认为洗稿工具没有创作出新的作品,只是单纯对已有的原创作品进行“抄袭”,判决洗稿工具提供方构成不正当竞争。

无论是道歉还是判决,这一系列事件让公众对内容领域中存在的抄袭行为有了更多的了解和认识,本文试图从法律和行业角度带给大家更多的信息,便于从业者加深对洗稿、伪原创的认识,从更底层的逻辑思考内容产业的未来。

从人工到机器:洗稿的演变

“洗稿”又称“伪原创”,说白了就是对别人的原创内容进行改头换面、移花接木,但其实最有价值的部分还是抄袭的,这样“清洗”之后的内容就可以打着原创的旗号投入内容领域,为自己换取名利。

“洗稿”最初还是通过人工进行的,并且已经形成了一个产业,《法治周末报》公众号推送的一篇《揭秘自媒体“伪原创”产业》显示,直接以“伪原创”、“洗稿”等关键词搜索QQ群,会出现几十个结果,其中有不少群都是2000人的大群,记者随机添加了几个群,发现群中探讨的话题多是如何创作出没有风险的“伪原创”内容,如何更快地通过原创检测、自媒体平台的审核等。

后来出现了机器洗稿,通过语义识别、拆词等算法直接对原创内容进行“清洗”,目前则形成了人工+机器的方式,先由机器进行第一次处理,然后人工二次“润色”,让抄袭更加“不留痕迹”,俨然发展出了“人工智能”模式。

(某洗稿工具的运行界面)

那么必须要追问,为什么这么多人和技术被投入到一个看上去很不光彩的领域呢?

我们知道,原创内容在互联网时代就等同于用户注意力,说白了就是流量,而流量则直接意味着收益。大量的平台斥巨资采购优质内容,同作者签署经纪合约,买断他们在一个时间段里的原创作品,为的都是用内容换流量,有了流量无论是通过付费阅读、打赏、广告、电商、衍生品开发、社群运营等等都可以获得变现。

结合一些行业的分析和统计数据,微信、头条、微博、百度百家、阿里文娱等诸多内容平台都已经成了创作者重要的变现渠道,不少作者在2020年甚至通过优质内容达到了千万量级的收入,加之越来越多的平台为了吸引优质内容,不断给予作者补贴、奖励、分成比例提高等等刺激,所以才有了“内容为王”的说法。

不难发现,围绕优质内容的生产和分发,形成了一个完整的平台生态,这个生态一方面源源不断提供优质内容给用户,另一方面又持续为作者带来收益,内容产业在中国发展到今天可以说借助互联网迎来了自己的春天。

然而,原创是一项颇具技术含量的工作,尤其是持续的优质内容输出,对于作者的要求非常高,而强烈的经济利益刺激之下,不少从业者开始考虑“走捷径”,把人家已有的内容“拿来主义”,尤其是如果还能够通过技术处理骗过平台的识别机制甚至是逃避法律制裁,岂不妙哉。

(网络上很容易找到这种洗稿工具的营销文案)

笔者在这次的“洗稿”案代理过程中,被告方竟然在法庭上讲出了一句“天下文章一大抄”,试图以此抗辩用机器洗稿不是什么大问题,实在是超出了笔者的认知能力,也许这恰恰是“洗稿”能形成一个产业的主观原因吧。

深入分析,机器洗稿的危害性是远超人工抄袭的,主要体现在以下几个方面:

1、机器洗稿大大提升了“抄袭”的效率,降低了抄袭成本,只需在洗稿工具上操作几个按键,批量生产出的“伪原创”文章便源源不断了,这有点像印假钞使用的电版,比人工一张一张的仿制快出几个数量级。

2、机器洗稿通常是“一条龙”式的服务,这一点在笔者代理的洗稿案中表现的非常明显,洗稿工具同时还具备从平台抓取原文、清洗之后定向发布到各大平台的一整套功能,使得抄袭后的内容堂而皇之地进入到内容领域,迅速稀释掉原创内容的浓度。

3、通过洗稿完成抄袭并非最终目的,洗稿之后的内容还要“骗过”各大平台的原创保护机制,再次为自己披上“原创”的外衣,进而收割用户流量和各种变现收益,此举便形成了对原创内容生态的彻底摧毁,因为这相当于在掠夺原创作者的劳动,把本该属于他们的流量收益据为己有,如果这种操作不被法律制止,相信只会“劣币驱良币”,越来越多的人放弃原创走向“洗稿”,而一旦内容产业失去了原创之水,最终必然失去用户注意力、失去增值收益的基础,洗稿者也迟早无稿可洗,内容产业就此彻底沦陷。

打一个形象的比方,机器洗稿就类似于向河流中排污的管道,污水源源不断注入,清流逐渐浑浊,直到最后整条河流鱼虾绝迹,再无任何使用价值。

机器洗稿的违法性认定

讨论当下的洗稿机器人生成的作品是否合法的问题,首先一个障碍就是著作权法对作品的界定,或者说著作权法保护的对象。这方面,无论是法理还是法律规定都是高度一致的,那就是著作权法保护的是表达而非思想。

既然保护表达,那么“洗稿”行为如果是人工完成的,究竟其是否构成侵害著作权就涉及到侵权比对的问题,2017年科技自媒体霍炬诉“差评”母公司著作权侵权一案,判决书显示“虽然两篇文章存在18处相似,但该18处就是主人公的真实经历,属于公知素材”,同时鉴于两文章采用表达方式不同等原因驳回霍炬诉讼请求,这个案件某种程度上反映出法院对洗稿后的作品侵权比对上存在的困境。

洗稿机器出现后,问题开始变得更加复杂。洗稿机器人处理过的内容如果要在表达层面与原作品进行对比,法官面临着一个新问题,至少在表面上看,两个内容在表达方式上还是有区别的,比如前文洗稿软件截图中展示的“卢梭的大部分著作中都提到了’好公民’这个概念”,被洗稿之后变成了“在卢梭的大部分作品中,都提到了’好公民’的概念”。这时候法官就要按照传统的侵权比对”实质性近似+接触”的原则来进行一番比对,然后给出一些理由说明这两者构成实质性近似,因此构成侵权。

但这种侵权认定方式会陷入到一个误区,那就是将机器生成内容等同于人工形成的作品,把机器放到了跟人同等的地位看待,将人与人的作品进行侵权比对的逻辑前提是法律认为不同的人有可能同时独立创作出一部实质性相同的作品,但洗稿机器人与人不同,它不存在独立创作的可能性,必须向它提供一个作品作为模版,然后它才能机械的进行“二次加工”,既不独立也没有创作,不符合《著作权法》规定的“独创性”要求。

笔者认为,洗稿机器人因为使用了原创作品这个行为本身就使其具备了法律上的“可责性”,因为它只不过是制造镜像,断无产生新作品的可能性,不论在这个过程中“镜像”技术有多完善,洗出来的稿子跟原作品在表达上有多大差异,本质上仍然是“抄袭”。

甚至再降低一点要求,我们用“独创性”原则适用之前被广泛采纳的“额头出汗”标准来评判洗稿机器人的生成内容,仍然不满足作品原创性的要求,洗稿机器人用一套“抄袭”算法针对性的把原创作品进行清洗,洗稿机器人的使用者只需要复制粘贴然后点击确认键就可以了,在作品的创作上没有任何“额头出汗”的过程,尽管洗稿机器人开发者在开发这款工具的时候也需要付出智力,也会额头出汗,但并不是为了原创而是为了更高效率的抄袭出汗,法律显然不能保护这样的“付出”。

机器“写稿”与机器“洗稿”

说到这里,不少人会想到,如果机器人不需要一个原创作品作为模版,而是通过机器学习或者开发者编程得到一套写作“算法”,这套算法虽然借鉴了之前一些写作的技巧和套路,但不是对某一篇文章的抄袭和改头换面,而是借助这套算法实时的根据收集的素材和数据“原创式”的生成一篇作品,这种情况下还构成侵权吗。

这是一个好问题,事实上写稿机器人已经在业内有着广泛的应用,据报道,2014年7月美联社宣布将采用AI公司开发的WordSmith程序进行公司财报类新闻的写作,此后短短几个月间,WordSmith就已经通过自主“学习”掌握了新闻写作的基本规范,2015年5月美联社与Automated Insights公司合作,尝试利用人工智能撰写财报新闻,每季度能生产近4000篇财报新闻。

国内写稿机器人的应用也初露端倪,2015年9月腾讯发布了尤其开发的自动化新闻写作机器人Dreamwriter撰写的一篇财经稿件《8月CPI同比上涨2.0%创12个月新高》,这是中国国内首次出现由机器人撰写的新闻稿件,稿件报道了中国国家统计局当日发布的8月份CPI指数,多为第三方分析师的观点,并介绍了CPI的含义。

从以上国内外实践情况看,写稿机器人和洗稿机器人虽然一字之差,但还是有本质区别的,二者至少在算法、内容生产方式和作品保护三个层面存在不同。

洗稿机器人(伪原创)

写稿机器人

算法是为了拷贝

算法是为了再创作

基于已有作品模版生成“镜像”

基于多个素材生成内容

生成的内容因不具有原创性而不应该成为“作品”

生成的内容可能因原创性成为“作品”

关于写稿机器人生成的作品能否得到《著作权法》的认可和保护,2020年南山法院审结了国内首例人工智能生成作品的侵权纠纷案,涉案被侵权的作品正是由前述腾讯开发的写稿机器人Dreamwriter撰写的,法院认为其外在表现符合文字作品的形式要求,其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断,文章结构合理、表达逻辑清晰,具有一定的独创性。从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。从涉案文章的外在表现形式与生成过程来分析,该文章的特定表现形式及其源于创作者个性化的选择与安排,并由 Dreamwriter 软件在技术上 “ 生成 ” 的创作过程,均满足著作权法对文字作品的保护条件,法院认定涉案文章属于我国著作权法所保护的文字作品,并构成开发者公司的法人人作品。

可见,写稿机器人生成的内容仍然可以作为法人作品获得法律上的保护,这一点使其跟洗稿机器人的生成内容形成了本质区别。

笔者认为,写稿机器人是机器学习和人工智能技术在文化创作领域的前沿应用,新技术的参与能够大幅度提高常规内容生产效率,同时让人解放出来,把时间精力投入到更深度、更优质的内容开发工作中,这种技术创新不但没有牺牲前人的创作成果,反倒贡献出更多有价值的内容,并且解放了人力资源,对产业整体而言是一种提升和赋能,是必须要大力支持和鼓励的。

对比机器洗稿,效果恰好相反,有价值的内容没有增加,却以牺牲原创为代价,造成的是产业整体的退步,法律就是要在这两种技术之间划出一道清晰的边界,让技术进步的车轮始终行驶在正确的轨道之上。

从这个意义上,可以说首例人工智能生成作品案和首例机器洗稿案这两个司法判例恰逢其时,让我们看到了曙光。

 作者简介:

编辑:方巧娟  主编:刘洋

(0)

相关推荐