【刑事实务】利用爬虫技术爬取电子书传播牟利行为如何认定
【版权声明】版权归原作者所有,仅供学习参考之用,禁止用于商业用途,若来源标注错误或侵犯到您的权益,烦请告知,我们将立即删除 。来源:2021年《人民检察》第10期 作者:刘为军 中国人民公安大学侦查学院教授 姜淑珍 北京市人民检察院第四检察部主任 李 慧 北京市海淀区人民检察院第二检察部检察官
编者按:
目前,侵犯知识产权新型犯罪不断涌现。在著作权领域,以复制、发行他人作品为主的传统线下犯罪升级为通过信息网络向公众传播他人作品的线上犯罪。为有效打击此类犯罪,保护知识产权,本刊特遴选北京市海淀区检察院办理的一起案件进行研讨,敬请关注。
案情简介
2016年,覃某某、柯某、刘某共同商议成立北京鼎阅文学信息技术有限公司及关联公司(以下简称“鼎阅集团”)。鼎阅集团自2018年开始,在覃某某等12名行为人负责管理或参与运营下,未经掌阅科技股份有限公司、北京幻想纵横网络技术有限公司、中文在线数字出版集团股份有限公司等权利人许可,利用爬虫技术爬取网络中正版文字作品,经技术处理后上传存放于第三方云服务器中,后通过其推广运营的“鸿雁传书”“TXT全本免费小说”等10余个APP平台传播,供他人访问、下载阅读,并通过广告收入、付费阅读等方式牟利。
经查明,涉案作品侵犯掌阅科技股份有限公司、北京幻想纵横网络技术有限公司享有独家信息网络传播权的文字作品共计4603部。其中,章节数目及内容100%相同的有3167部,具有相同内容的侵权章节比例在90%以上不到100%的1087部,具有相同内容的侵权章节比例80%以上不到90%的161部。涉案作品侵犯中文在线数字出版集团股份有限公司享有独家信息网络传播权的文字作品共计469部。其中,章节数目及内容100%相同的有17部,具有相同内容的侵权章节比例在90%以上不到100%的257部,具有相同内容的侵权章节比例在80%以上不到90%的59部,具有相同内容的侵权章节比例在70%以上不到80%的44部。
分歧意见
关于爬取电子书并在自营APP上推广运营行为的定性,第一种意见认为,行为人爬取相关作品是为了技术数据研究需要,属于合理使用,该行为仅为民事侵权,不构成犯罪。第二种意见认为,行为人具有侵犯他人著作权非法牟利的主观故意,并实施了具体行为,构成侵犯著作权罪。
关于侵权作品数量的认定,第一种意见认为,部分侵权作品与正版作品章节内容相同度不到100%,这些作品不应计入犯罪数额。第二种意见认为,部分侵权作品即使爬取的章节比例不到100%,但是所爬取的章节内容与对应的正版作品章节内容相同度是100%,且大部分侵权作品的爬取章节比例都在80%以上,这些作品应计入犯罪数额。
问题一:关于利用网络爬虫技术爬取电子书行为的定性
主持人:该案中,行为人未经权利人许可,利用网络爬虫技术爬取正版电子书并在自营APP上运营推广的行为,是否属于著作权法中“个人基于学习、研究需要合理使用他人已经发表的作品”的范围?其行为是民事侵权行为还是涉嫌犯罪?
刘为军:该案发生在刑法修正案(十一)生效之前,应适用行为时法,其定性主要涉及行为人“营利目的”的判断问题。根据2011年最高人民法院、最高人民检察院、公安部《关于办理侵犯知识产权刑事案件适用法律若干问题的意见》第十条规定,除销售外,具有下列情形之一的,可以认定为“以营利为目的”:(一)以在他人作品中刊登收费广告、捆绑第三方作品等方式直接或者间接收取费用的;(二)通过信息网络传播他人作品,或者利用他人上传的侵权作品,在网站或者网页上提供刊登收费广告服务,直接或者间接收取费用的;(三)以会员制方式通过信息网络传播他人作品,收取会员注册费或者其他费用的;(四)其他利用他人作品牟利的情形。该案中,行为人在未经权利人许可的情况下,通过爬虫技术非法获取并传播他人作品,并通过其推广运营的APP平台传播,供他人访问并下载阅读,后通过广告、付费阅读等方式牟利,显然符合上述规定,具有明显的营利目的。
值得一提的是,爬虫技术的应用一定程度上有利于数据流通和再利用,虽然区分罪与非罪的关键在于是否“以营利为目的”,但不能一概认为数据爬取行为即具有不正当性。从有利于司法适用的角度来看,未来仍有必要对数据爬取行为进行更精细的界定,从而为技术的发展和应用提供科学合理的空间。
姜淑珍:关于覃某某等人行为性质的认定,需要注意以下四点:其一,覃某某等人的行为并非“合理使用”。为兼顾著作权人利益保护与促进知识与信息广泛传播,著作权法确立了合理使用机制,即在特定条件下,法律允许他人自由使用享有著作权的作品,不必征得权利人的许可,也无需支付报酬。著作权法明确规定了合理使用的十二种情形,其中第一种情形即“为个人学习、研究或者欣赏,使用他人已经发表的作品”。该案中,覃某某等人爬取作品后传播牟利,显然并非用于个人学习、研究和欣赏,不应认定为合理使用。其二,覃某某等人的行为无法以技术中立免责。从技术中立的角度来看,爬虫技术本身并不当然违法,在读取、搜集互联网信息时,数据爬取行为本质上是对信息内容的复制,本着互联网开放共享精神,这种临时复制行为若未采取破坏手段、未违背爬虫协议约定是被允许的。技术中立免责是仅对技术提供者而言,若爬虫技术提供者未参与侵权,且不明知他人运用爬虫技术侵权,可以免责。但该案中爬虫技术控制者覃某某等人将爬取的信息内容在自营APP上推广,系利用技术直接实施侵权,已与技术中立原则无关。其三,覃某某等人的行为不适用避风港规则。该规则是指对于不提供信息内容,只提供技术服务、网络空间的网络服务提供者,在目的合法的情况下,一般不对使用其服务的网络用户的侵权行为承担法律责任。但该案中覃某某等人系向他人提供具有网络信息内容的服务,故不应适用避风港规则。其四,覃某某等人的行为构成侵犯著作权罪。覃某某等人实施相关行为时刑法规定了五种构成侵犯著作权罪的情形,其中对文字作品侵权构成犯罪的行为是,以营利为目的,未经著作权人许可,复制发行其作品,非法所得数额较大或有其他严重情节。就该案而言,最高法、最高检《关于办理侵犯知识产权刑事案件具体应用法律若干问题的解释》中规定“通过信息网络向公众传播他人文字作品……的行为,应当视为复制发行”(此次刑法修正案(十一)将该解释内容写入法条),因此覃某某等人的行为属于“复制发行”他人作品;通过广告收入、付费阅读等方式牟利,营利目的亦足以认定;且行为情节已达入罪标准,故构成侵犯著作权罪。
李慧:从通俗意义上讲,爬虫技术是一种按照一定规则自动抓取互联网信息的程序或者脚本。爬虫行为是否构成违法犯罪,需进行实质层面的违法性判断。
首先,对网络爬虫行为的违法性认识,应注重从技术本身及数据使用行为两个维度考量。著作权法和国务院《信息网络传播权保护条例》中明确,侵害信息网络传播权的行为包括内容提供行为和网络服务提供行为,虽然对后者设立了避风港规则,但该案中,被告单位的行为已超越单纯的提供技术、设备支持和中介服务的范畴,系内容服务的提供行为。进一步讲,司法实践中,对以技术中立原则给予法律责任豁免的情形,通常限于技术提供者,对于实际使用技术的主体,则应视其具体行为是否符合法律规定进行判断,进而厘清技术中立与恶意使用行为的界限。
其次,网络爬虫行为是否具有刑事可罚性,需要具体分析所爬取数据的性质以及数据本身拥有的权利保护规则。网络爬虫行为入罪与否的关键在于访问、爬取数据是否获得许可和授权、技术实施过程是否具有破坏性。网络知识产权除了具有数据表征外,还具有创造性价值,未经权利人许可、授权而非法复制、下载等,应构成侵犯知识产权犯罪。
最后,对网络爬虫行为刑事违法性的实质审查,应着眼于个案实际从主客观两个方面来考量,既要审查行为人主观上对爬虫技术的使用目的、实施过程、可能后果是否具有明知性,更要审查行为人实施爬虫行为是否具有社会危害性。该案中,鼎阅集团非法创设10余个APP,大量爬取传统网站需要花费高额版权费才能获取的作品资源,以较低成本非法牟利,以技术中立掩盖违法之实,且在案发前为毁灭证据多次实施紧急下架行为,系主观明知下的恶意侵权行为,理应受到刑事法律的规制。
问题二:关于侵权作品数量的认定
主持人:该案中,涉案公司电子作品数量庞大,合法作品与侵权作品混杂,且侵权作品中爬取到的作品章节比例也不一样。此种情况下,如何认定侵权作品数量?如果构成犯罪,如何认定犯罪数额?
刘为军:无论是部分复制网络文字作品还是部分复制后进行一定程度的修改,判断焦点都在于是否触及著作权的独创性和基于独创性的利益性。通常情况下,行为人将侵权作品与原创作品混杂,或者对他人作品部分摘取、改编和创新,这种情形下,如何认定传播他人作品数量存在较大困难。该案中,行为人部分复制文字作品,不能单纯以比例作为评判罪与非罪和认定侵权作品数量的标准,而应从著作权的核心出发,从形式表现和独创性角度进行认定,确定实质相同。
姜淑珍:网络文学作品常以连载形式出现,侵权盗版“作品”更新速度常慢于原创正版,或因有遗漏等因素,导致侵权盗版者未能完全复制;又因电子文档易被篡改,有时侵权盗版者在复制时会进行一定程度的修改,出现侵权作品与被侵权作品不完全一致的情况。对于这种部分内容相同的作品,能否认定为侵权作品进而计算数量,存在不同观点。有观点认为必须内容完全相同,才属于刑法意义上的复制;也有观点认为应按比例考量,相同内容比例达到一定程度的才可认定;还有观点认为不应考虑比例,应以“实质性相似”标准加以判断。“实质性相似”标准源起于美国20世纪初,从专家证人角度评估被侵权作品的独创部分,再从普通人角度整体评判被告作品是否系抄袭。以“实质性相似”为侵权判定标准,不再要求对作品内容完全相同的复制,从而形成对著作权的更好保护。我国民事著作权侵权裁判中,“实质性相似”标准已常见使用,刑事判决中“实质性相似”标准判断也时有出现,网络文学作品侵权认定采用该标准,具有其合理性。但是,“实质性相似”如何判断,如按照“专家证人评估+普通人整体评判”方法,难免失之于主观,故具体判断时,先以比例考量更具可操作性。一般而言,对于具有独创性的作品,如果侵权作品与之相同字节数占比80%以上的,应可直接判定为具有实质相似性。对于占比70%左右的,建议再从作品独创性角度出发,根据思想表达两分法,从题材、体裁、主题、情节、事实、结构、角色、文字表达等角度,综合考量两作品是否实质性相似。
李慧:囿于不同权利公司营销模式的迥异,不同作品连载更新节点及发布路径的差异,以及行为人爬取及发布时间的不同,网络文字作品的传播除了具有灵活性、便捷性和实时共享性,更具有动态性、阶段性及片段化特征,体现为绝大多数作品不是整部同时发布,而是分章节、有进度地发布,随时或定期更新,逐章或逐节供读者阅读下载,这导致电子书爬取内容与正版电子书内容存在一定差异。因此,对侵权作品的数量认定,既应在现有法律规定框架内做到审慎客观,又不应拘泥于传统认定方式。一方面,应在对众多权利公司,海量作品权属,繁杂授权文件全面梳理的基础上,确立“按步骤、按公司、按比例”的认定方法,即在对涉案作品作异同性比对中,按照区段准确区分不同作品的爬取比例,进而为科学认定侵权作品数量提供真实客观基础。另一方面,鉴于电子作品的独特属性,借助网络平台传播已突破了传统认知下作品有形复制件的物理转移,大大拓展时空维度和共享范围,导致数字化环境下复制件数量的绝对增加。对此,亦不能简单地将正版电子书的部数与相关司法解释中规定的传统纸质盗版图书的复制册数作等量计算,应该把被侵权作品的数量作为评价侵权犯罪行为情节及侵权作品数量的重要参考标准。
问题三:电子证据的收集、提取及鉴定
主持人:该案中,涉案侵权作品数量庞大,且以电子形式存储于第三方云服务器中,电子证据的收集、提取及鉴定相对复杂。对此,办案中,司法机关在收集、提取及鉴定电子证据中应注意哪些方面?
刘为军:网络侵犯著作权犯罪电子证据的收集、提取和鉴定,应重视能够反映行为人非法经营数额、传播他人作品的数量,传播他人作品的实际被点击数以及注册会员人数等用于认定犯罪事实和情节的证据。
首先,对电子数据及时固定,防止证据灭失。一般来说,侦查人员首先应当对原始存储介质进行封存,如行为人用于实施犯罪行为的计算机等。同时,通过远程勘验手段及时固定服务器、云存储空间中的电子数据,并通知有关单位和人员予以配合。
其次,及时提取用于认定案件事实的电子数据。重点提取行为人发布侵权作品所产生的点击率和网站会员人数数据,同时注意区分行为人侵权作品与原创作品混杂以及部分摘取、改编的情况,准确区分合法收入与非法经营数额。具体搜查、调取电子数据时,侦查人员应做到具有针对性、谨慎和细致三点要求。针对性是指侦查取证工作必须有计划有目标地进行,以提高取证效率。可以通过对行为人的细致调查和精心讯问,了解其作案手段,并与著作权人沟通,确定重点取证对象等。电子数据往往易灭失,难恢复,取证应当小心谨慎。侦查人员在非紧急情况下应当取得相关技术人员的支持才可开展取证操作。同时,网络侵犯著作权犯罪具有隐蔽性特点,诸多有价值的信息分散在各个磁盘、文件中,需仔细全面勘查,挖掘隐藏信息。
最后,进行电子数据的关联认证。对于网络侵犯著作权案件,强化电子数据的关联认证,即证明行为人与犯罪行为之间的关联性是证明的关键:第一,对扣押的计算机、手机等设备与涉案设备的IP地址、Mac地址等进行对比,证明相关设备与犯罪行为之间的关联性。第二,证明行为人与涉案设备的关联性。收集行为人所使用的计算机、服务器、银行卡等物理证据,对指纹、DNA等痕迹物证进行勘验检查,进行同一比对。第三,证明账号的关联性。行为人销售外挂、运营、维护侵权网站等行为,通常都有相关的QQ、微信、支付宝等账号,将获取的账号与涉案账号进行比对,证明账号与案件事实的关联性。第四,证明行为人与该账号之间的关联性。注重收集涉案账号常用登陆地址、登陆设备以及相关注册信息等证据,与行为人的网络地址和身份信息进行比对,以证明行为人对涉案账号的使用。
姜淑珍:在网络犯罪案件查办中,电子数据常被称为“证据之王”。互联网技术发展迅猛,导致电子数据获取、审查与运用也需要“与时俱进”。首先,电子数据的收集,应遵循及时全面的原则,案发后如具备条件,可先对涉案网站等进行网络在线提取或远程勘验,固定相应证据,特别是需要对程序运行进行动态取证的,更应及早固定收集;在案发现场,应注意对涉案单位运营使用的计算机、行为人使用的手机等,全面扣押和封存,并对其中存储数据进行检查或送第三方鉴定机构出具鉴定意见,并应关注涉案公司架构、日常管理、经营、资金流转、行为人之间联系等。其次,应关注该案体现的互联网云端数据特点,APP以及云存储的运用。该案中,电子数据的获取和审查,不仅需要关注传统电子数据取证需注意的提取主体适格、程序合法、提取方法符合技术标准或规范以及电子数据取证结果的哈希值计算,固定取证结果,保证电子证据真实性不被篡改等,还需要关注云存储的新特点。如,对云端数据的获取,由于其分布式存储的特点,无法以扣押或封存计算机的方式进行取证,一般需研究客户端的应用,通过账号访问的方式获取,因此账号用户名及密码的获取格外重要。再如,云存储环境下取证时有时涉及其他用户数据混同的问题,如果全盘获取侵犯其他用户信息权,可能会导致证据合法性受到质疑,取证时应注意避免。
李慧:该案系一起利用爬虫技术非法获利的高科技类犯罪,亦是一起网络侵犯著作权的知识产权类犯罪,电子证据是案件侦办的牢固基石,技术鉴定是案件诉判的关键内核。
首先,应重视从源头锁定侵权作品数量,全面固定电子证据。该案涉案作品数目庞大、涉及权利公司众多、侵权时间周期较长,且案发前后删除下架侵权作品,原始网络环境难以再现,特别是云存储服务器到期会导致关键证据灭失、犯罪链条中断,因此,充分借力专业技术辅助办案、及早从源头提取固定侵权作品尤为重要。对此,需着眼于不同权利公司调查取证实际的差异化特点,一方面,及时引导公安机关从存储服务器上下载镜像文件,经固定保存后送交电子数据鉴定中心鉴定;另一方面,在对手机下载电子书过程进行保全公证的基础上,依据源代码等相关技术对电子书文件进行提取固定及破解。
其次,注重对电子证据的分类调取,逐项固定,完整追踪。电子证据具有易失性、时效性及易篡改等特点,在利用爬虫技术侵犯著作权案件中应充分核查侵权作品来源、引导公安机关调取平台点击量数据、核实侵权作品被实际阅读的数量;通过对行为人计算机现场勘验,提取数据流书单、爬虫软件以及财务数据,明确行为人客观行为及分工情况,审查涉案公司获利及人员分红情况。
最后,对涉案技术事实和犯罪构成的实质审查是定案的核心要素。应在解决专业技术性难题中突破法律认知局限,确立“多维鉴定”思路,实现对涉案侵权软件、侵权作品内容、复制传播原理等的系统性鉴定,即涵盖作品内容异同性、侵权APP功能、广告展现功能、内容获取路径、手机及涉案数据提取在内的全方位鉴定。
问题四:关于该案的性质
主持人:该案属于单位犯罪还是自然人犯罪?对该案中的行为人如何定罪处罚?
刘为军:该案中,覃某某、柯某、刘某成立北京鼎阅文学信息技术有限公司及关联公司,在12名行为人负责或参与运营下,实施犯罪行为,且组织结构严密,成立单位犯罪,应对直接责任人进行处罚。
姜淑珍:认定属于单位犯罪还是自然人犯罪,需从以下几方面进行综合考虑:一是涉案单位是否存在及其存在的合法性。涉案单位是否合法存在,是判断能否认定为单位犯罪的前提。合法存在的单位,需依法设立,拥有相应的营业执照;并需进一步实质审查单位是否为了从事正当经营而成立,以及成立后是否以正常、合法经营为主要活动。具体到该案,鼎阅集团成立两年后开始实施犯罪,单位应系合法成立、存在,并有其他正常经营,故应重点审查鼎阅集团是否以实施犯罪为主要活动。何为“以实施犯罪为主要活动”并无法定量化标准,具体需从案件事实出发。该案中建议着眼于侵犯著作权犯罪行为与正常合法经营行为的比例情况,综合考虑二者经营时间、规模、投入、收益等因素加以判断。二是实施侵犯著作权的行为是否为单位决策。单位决策与个人决定的区别一般在于是否经过单位决策层依照相关程序研究决定。当然,有些单位实施犯罪行为,并未经过正式集体商议,但决定实施相关行为的人员向有决策权的人进行了汇报或有决策权的人事后追认或默许的,也应评价为单位决策。三是犯罪行为是否由单位实施。所谓单位实施,指在单位决策的前提下,是否由单位人员实施,且一般系以职务行为实施。此外,也可根据实施犯罪的成本,如设备的使用,人力、物力投入等是否来源于单位,加以判断。四是犯罪行为是否为单位受益。单位受益的典型表现是犯罪所得归单位所有,如涉案侵犯著作权行为所牟取的非法收入,是否进入单位账户或为单位经营、开销所用等。
综上,该案应认定为单位犯罪,从各行为人的行为来看,负责集团全面运营及管理的覃某某应当对全部犯罪事实承担责任;其余仅负责实施部分环节的行为人,需注意审查核实其主观上对单位侵权行为的明知程度,在此基础上根据其行为对整个犯罪实施的重要程度确定刑事责任。对于一般员工,如仅系听从公司安排,实施职务行为,未获得正常工资之外的额外收益,对实施犯罪作用不大的,不宜追究刑事责任。
李慧:核实单位犯罪不仅要对公司的组织架构、经营模式、工作性质等进行综合评判,更应重点审查其成立后的主要经营收入来源及资金归集去向。该案系单位决策下以营利为目的、有组织有分工的单位犯罪。鉴于该案涉案人员众多,犯罪分工明确,层级跨度较大,对行为人的定罪处罚应从以下几个层面考量:第一,按照地位、层级、作用,明确单位犯罪主管人员及直接责任人员。覃某某、柯某、刘某等系鼎阅集团的高层管理人员,虽然分管职责不同,但在侵权犯罪活动中都起到了关键作用,故应认定为直接负责的主管人员。结合其他人员的主观明知程度及客观行为,认定其余几人为其他直接责任人员。第二,充分论证行为人参与侵权程度的大小,准确区分主从犯。通过重点审查同案犯口供、证人证言、聊天记录等关键书证,结合工作时间、职责内容、管理权限,将公司高层管理人员及技术负责人认定为主犯。第三,鉴于单位犯罪中不同行为人职责差异及部分行为人认罪认罚情况,提出阶梯等差式量刑建议。
问题五:关于检察职能作用的发挥
主持人:在网络时代,著作权保护面临很多难题,司法办案中,检察机关如何发挥职能作用,强化著作权司法保护,服务保障创新型国家建设?
刘为军:当前,知识产权在科技变革引领下正在飞速发展,在此背景下,检察机关有条件也有责任充分发挥检察职能,强化知识产权检察保护,不断加大新兴领域知识产权侵权违法犯罪行为惩治力度。一是整合司法资源,形成监督合力。2020年11月,最高人民检察院成立知识产权检察办公室,整合刑事、民事、行政检察职能,推动形成检察办案监督合力,统筹加强检察机关知识产权制度设计和研究指导。二是整合社会资源,强化沟通协调。除了成立专门机构外,检察机关还应通过检企合作、检校合作等形式加强与企业、科研机构等的联系,提升在案件线索发现、电子证据收集与固定等方面的办案能力。三是及时发布指导性案例,形成知识产权保护的标准体系。通过制定司法解释、发布指导性案例等方式加强引导,为侦查取证工作指引方向,统一证据规格。同时还可以成立知识产权案例库以及检索平台,供司法机关、科研机构、企业、律师进行查询,为知识产权保护问题建立标准、提供引导。
姜淑珍:针对网络著作权保护的技术难题,应推动司法办案和检察技术融合,细化有专门知识的人辅助办案、技术人员加入办案组等机制,根据办案需求采取技术审查、专业同步辅助审查等多种形式,充分利用内部资源,以检察技术作为支撑解决办案中的技术难题。同时,也可充分借助“外脑”,从科研院校、研究机构、互联网企业等聘请相关领域专家,借智集力解决专门问题。在办好案件的基础上,注重综合治理创新,针对案件办理中发现的互联网著作权保护管理漏洞、被侵权风险,通过制发检察建议、发布调研报告等,促进有关部门、行业组织、企业加强著作权保护。此外,还应认真落实“谁执法、谁普法”的普法责任制,充分利用检察机关宣传资源和平台,发布普法类网络犯罪典型案例,揭示犯罪行为模式和危害本质,提高社会公众的风险防范意识和著作权保护意识。
李慧:办理网络侵犯著作权犯罪案件,了解新技术原理、新犯罪手段、新犯罪形式是前提,转换办案思路、提高打击精准度是落脚点。一是从优化办案机制处破题,从夯实证据根基处着力。针对新型案件,应发挥审前主导作用,提前介入引导侦查,规范电子证据调取,对于公安机关、检察机关认定不一致的案件,应及时沟通研判。二是借助专业辅助力量,补强技术短板,着力破解取证难题。三是以个案借鉴、逐案沟通、类案总结的方式,就法律适用和量刑方面积极与法院会商研判,在法律规制范围内合理拓展刑罚适用的边界。既对犯罪新样态保持与时俱进的敏锐度,也应依托个案推动的方式破解难题、突破创新。四是充分发挥司法办案在社会综合治理中的规范引领作用,加大著作权保护力度,唤起全社会保护知识产权的法律自觉。