本期导读:
说起大数据产业,“金融市长”黄奇帆依然头头是道。对于互联网巨头以强势地位大数据杀熟,未经同意转让(买卖)交易数据的行业乱象,黄老先生给出了自己的观点,非常专业值得探讨。
“数据如果不进行分类,就会出现'黄金’和'垃圾’一起卖的情况。”
10月24日,复旦大学特聘教授、重庆市原市长黄奇帆在第三届外滩金融峰会上指出,合理分配好数据的管辖权、交易权、所有权、使用权、财产分配权,能够有效促进数据资源转化为数据资产,有利于保护数据主体权益并维护数据安全。在此基础上,进一步厘清数据交易平台的基本原则、交易规范、交易产品,健全数据市场发展机制,将带动国内数据交易产业链蓬勃发展。
数据是数字经济发展的基础性、关键性、决定性的生产要素,但当前还存在着数据权属和交易规则不明确、交易不活跃、贸易规则不统一等诸多问题,需要进一步完善理论体系。我今天在这里与大家一起探讨下我对这些问题的思考,供各位参考。 在人类认知产生以前,从物质的最小单位夸克到原子、分子、细胞乃至生态系统,构成了客观的物理世界,而对于上述客观物理世界未经处理的原始记录,就是数据。人类诞生以后,将客观世界的数据以编码的形式表达出来,就形成了信息。数据强调的是客观记录,信息强调的是对客观记录的解释,是一种已经被加工为特定形式的数据,例如文字、语言、音乐等。而知识是人类基于认知模型,对信息进行结构化重组而形成的系统性认知。显然,数据是基础,信息和知识是人工处理后形成产物。 数据是取之不尽、用之不竭的。与土地、劳动力、资本等生产要素不同,数据作为客观世界的“符号”,随着客观世界的演化而不断产生,从这个角度,我们可以将数据看成客观世界“熵”的反映。 数字的增长是指数级的。数据的增长类似于细胞分裂,数据自身迭代能产生新的数据,不同的数据碰撞也能产生新的数据,数据的衡量维度不久之前是PB,现在是EB,未来很快将变成ZB。 原始数据是碎片化的,没有意义的。知识的产生要经历数据、信息两个阶段,意味着如果没有人类组织、加工,这些数据自身对于社会是毫无意义的。 数据总是已经被加工过的,不可能完全的“原始”。从人类的视角来看,数据的出现就意味着处理、分析流程已经在运作。数据的加工过程就是将处于原始状态的无序数据,变成有序数据的过程。 数据在利用过程中产生了价值与产权。数据经过人工与机器处理成信息,再变成决策判断、信用判断的工具,为数据平台带来了商业利益,从而创造了价值。同时,数据价值在创造的过程中,数据的产权归谁所有,利益如何分配,也是数据利用所面临的一项重大课题。 数据可以多次转让和买卖。数据是无形的,作为一种非消耗性资源,使用越多,产生的数据越多,其可能带来的价值就越大。 数据产权归属决定着如何在不同主体间分配数据价值、义务和责任。与其他各类生产要素不同,数据的产权问题仍未解决。我认为数据涉及到以下五项基本权利:管辖权、交易权、所有权、使用权、财产分配权,各类主体基于自身在数据交易环节中的位置来行使相应权利。 数据是一个国家的新型基础性资源,对经济发展、社会治理、人民生活产生着重大而深刻的影响,这意味着任何主体对数据的非法收集、传输、使用都可能构成对国家核心利益的侵害。 因此,各类数据活动具有公共产品的特性,它的管辖权、交易权应当归属于国家,内部的任何数据活动都应该遵循国家数据安全法规。国家可以成立中央数据部门对国内的数据活动进行统一管理,在确立总的管理规则后,主要城市可以设立定点数据交易所,类似在北京、上海、深圳设立的证券交易所,而其他的一般省会城市、地级市不能设立。同时基于人工智能和区块链技术建立数据可追溯系统,对数据无论是交易、使用、财产分配,有全息的可追溯过程,并且保证是不可更改的,从而保证数据交易安全有序。 数字经济时代,全球数据量呈现出爆发式的增长,大数据应用产生的经济价值不断显现。个人的基本信息和基于自身行为产生的各种数据,个人理应享有所有权。但在数字化时代,个人数据需要参与到各类网络双边交易中,在平台上经过加工处理成了信息、知识,对于交易双方才有意义。当某个平台把碎片化的价值不高的数据加工成有方向、有意义的数据,这个平台一般应该拥有所有权。因此,双边交易中产生的数据,关系到参与各方,数据产权原则上应当共有。基于数据所有权的共有原则,平台不能基于强势地位进行大数据杀熟,也不能未经个人同意将个人数据转让给其他主体。 数据使用权即使用指定数据的权利。由于数据能够低成本复制,在使用过程中一般也不会造成数据的损耗和数据质量的下降,反而还会因为数据的使用创造新的经济价值,因此数据的使用权转移是一件多方共赢的行为。 但是,数据在使用权转移过程中,往往已经被加工成了相应的数据产品或数据服务,成为了类似于影视、音乐的知识产权。知识产权是不允许再转售给他人的。与此类似,数据的使用权通常不允许转授,数据的使用者也不能将数据转手倒卖获利。 互联网平台采集了个人数据形成了产品和服务,这个过程中,个人扮演了“数据贡献者”的角色,平台将个人数据进行了二次加工,在这个过程中也付出了人力、物力、财力,最终呈现的数据产品/服务是两者的共同创造,所以理论上随之产生的收益应当分配给参与生产环节的各相关者,不应由任何一方独享全部收益,这样有违公平原则。 数据该如何定价比较合理呢?数据的定价一定是市场化的,即发挥市场在数据资源配置中的决定性作用,由交易的双方根据数据的价值协商确定它的价格。 数据变现最终形成的收益,原始数据生产者与二次加工者都应当享有分配权。数据财产权的分配比例,可以大致模仿知识产权的分配模式。比如,美国拜杜法案出台后,确定形成了知识产权收益1/3归投资者,1/3归发明者,1/3归转化形成效益的转化机构这一基本格局。拜杜法案的逻辑在数据交易方面同样适用。作为拥有大量个人数据的平台,也应当将数据交易收益的20%-30%返还给数据的生产者。 数据是数字经济时代的“石油”,但目前来看,数据价值分类体系在全世界都是相当落后的。例如,有的数据天然就是资产,有的数据需要加工才有价值;有的数据价值具有长期性和稳定性,有的数据价值存在显而易见的时效性。这些数据往往混杂在一体,如果不进行分类,就会出现“黄金”和“垃圾”一起卖的情况。不同的主体,应该基于自身对数据的理解和应用,建立适合平台自身的数据价值分类体系。比如对于政府,要建立不同行业、不同政府服务机构的公共数据体系。对于互联网平台,要区分个人隐私数据、交易数据、社交数据、日志数据等,按照不同的业务主体分门别类的进行管理。实行数据分类分级也是保障数据安全的前提。 近年来,我国数据交易市场整体呈现蓬勃发展态势。但另一方面,从国家层面缺乏统一的大数据交易规范,交易主体、标的、定价都尚处于探索阶段,有必要厘清一些关键的原则性问题,为数据要素市场的发展奠定良好的基础。 首先,数据交易所必须由国家管理,可以是政府直接出资,也可以是国有的数字化企业投资,或者在股权设计上可以采用多元化股权、混合所有制结构,但一般应该国家控股管理。国家资本控股可以保证数据安全,还能进一步建立信任、打破数据孤岛,在交易中确保公平公正,杜绝灰色交易的发生。 其次,明确数据交易所的法律地位,数据交易所是所有数据交易的枢纽。一方面,通过统一的数据交易所进行各类数据交易,可以增加数据交易的流量,提高数据交易的效率。另一方面,统一的数据交易所还能解决买卖双方互不信任的问题,打击地下非法大数据交易。在这个平台上,还可以开展数据期货、数据融资、数据抵押等衍生业务。 3.激活数据要素市场,建立“1+3+3”的数据产品体系 当前我国数据交易平台存在活跃度低、交易量不足等情况。究其原因,除了当前数据交易处于起步阶段外,数据交易产品、服务尚不完善也是重要原因。为了更好的激活数据要素市场,可以建立“1+3+3”的数据交易产品体系。“1”就是数据,是有价值的数据;第一个“3”和数据处理中心有关,指的是交易数据处理中心的存储能力、通信能力、计算能力;第二个“3”,是算法、人工智能、系统性的解决方案。 一切数据交易的前提是要素数据化、数据要素化。各种场景要素要经过加工处理形成可观测的数据。同时数据要发挥作用,也要统一数据标准,符合要素市场质量方面的要求。 不仅仅是数据方面的交易,数据处理中心的通信能力、存储能力和计算能力这三项能力也可以作为交易的标的。未来国家间数字化能力比拼的重要方面就是数据中心的数据处理能力。在此基础上,形成的数据资源越强大,国家的数字核心竞争力就越强。预计到2025年,在“新基建”推动下,我国将新增超过2000万台服务器。数据处理中心如果有闲置的存储能力、通信能力、计算能力,可以在数字交易所挂牌买卖。 最后,数据处理中心的通信能力、计算能力、存储能力的背后,还涉及到算法、人工智能、系统性的解决方案。数学家、程序员开发、优化的算法,基于大量数据形成的人工智能解决方案比如语言识别、自然语言处理,数字信息处理的系统性解决方案、数字软件都可以在数据交易所中进行成果的资产变现。 总而言之,数据作为和土地、资本、劳动力、技术一样的生产要素,在数字经济不断深入发展的过程中,将居于越来越重要的地位。合理分配好数据的管辖权、交易权、所有权、使用权、财产分配权,能够有效促进数据资源转化为数据资产,有利于保护数据主体权益并维护数据安全。在此基础上,进一步厘清数据交易平台的基本原则、交易规范、交易产品,健全数据市场发展机制,将带动国内数据交易产业链蓬勃发展!