本文核心内容首发于《经济日报》2020年10月23日“中经智库”栏目,原标题为《制度设计是数据要素定价的关键》。
数据已经成为与土地、劳动力、资本、技术并列的五大生产要素之一。根据IDC公司测算,2010年全球产生的数据量仅为2ZB,而到2025年则将高达175ZB。联合国贸发会统计显示,代表数据流量大小的全球互联网协议(IP)流量从1992年的约100GB/天增长到2017年的45000GB/秒,预计到2022年全球IP流量将达到150700GB/秒。但是,数据量高速增长的同时,作为一种中间品投入,数据要素的定价机制及其经济价值统计或会计核算都还刚刚开始探索,并逐步引起业界、学界和政策制定者的广泛关注。数据要素的定价和核算对于一国数据资产的厘清、数据资源的有效配置至关重要,因此需要加强相关理论和政策研究。
数据本质上是对物品、服务或经济主体等相关信息的电子或非电子形式的记录。讨论数据要素问题,至少要分清四类数据。第一类数据本身就是最终商品或服务,比方我们在线读资讯看视频,此时数据不是中间品,因此不是生产要素;第二类是作为生产要素直接进行交易的数据,比如大数据交易所里打包交易的数据;第三类是数据作为企业内部生产要素帮助提升最终产品或服务的性能或生产效率,比如引流、效果广告、配送优化等,但并没有在市场中去直接进行数据交易;第四类是数据作为生产要素在兼并收购或战略合作中有价值体现,但并非直接交易数据,而只是作为并购或合作谈判的一个筹码。实践中,用户通常接触到的是第一类情形的数据,但它并不是生产要素。第二类和第三类情形的数据是我们通常理解的成为生产要素的数据,而第四类情形目前在业界也很常见。从资源化到资产化,数据成为生产要素是一个渐进的过程,并不存在一个标志性的时间点。从威廉·配第的“土地为财富之母,而劳动则为财富之父和能动的要素”,到产业革命引发了资本和技术成为推动长期经济增长的关键要素,再到当前数据越来越成为数字经济运转的“新石油”,我们可以看出,任何一种生产要素真正发挥作用都不是一蹴而就的,而是在生产实践中不断融合培育出来的。
2020年4月9日中共中央 国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,明确提出要“加快培育数据要素市场”,这是面向新一轮技术和产业变革的重要战略部署,但并不意味着数据已经成为了所有行业都必不可缺的关键生产要素。实际上,即使对于高度依赖数据的互联网行业来说,过去二十多年中国互联网行业的发展过程中很多数据也都只是沉睡在那里,并没有发挥出太多价值,有时候甚至成了一种负担,比如曾经一些邮箱和网盘服务就因数据存储成本过高而出现经营困难。不过值得注意的是,以人工智能、大数据、云计算等数字技术为代表的通用目的技术应用表现出显著的数据偏向性技术进步特征,从长期趋势来看,数据要素终将大规模地渗透进生产、分配、交换和消费的各个环节,提升全要素生产率和推动全球经济新一轮持续增长。
作为生产要素的数据,对其进行定价和价值核算非常重要。数据要素的交易毫无疑问首先就需要定价机制,投资并购和战略合作的时候也需要对要素的价值进行估算。实际上即使不进行外部市场交易,在公司内部不同的事业群和不同的业务单元之间,还是需要给数据要素进行价值认定。因为只有厘清了价值,才能更有效率地进行内外部地资源配置。此外,统计和会计部门从各自工作管理角度同样需要对数据价值进行核算。据了解,目前国家统计和财政等有关部门都在进行这方面的制度和技术探索。那么,数据要素定价和核算到底难在何处?很多人可能非常自然地会认为,数据要素定价和核算最困难的地方是在于其无形性。这实际上只是一种表象理解。按照通常界定,无形资产是指企业拥有或者控制的没有实物形态的可辨认非货币性资产。对于数据要素定价来说,最困难的地方不在于其无形性,而是在于其“可辨认性”,也就是《企业会计准则》里所说的“能够从企业中分离或者划分出来,并能单独或者与相关合同、资产或负债一起,用于出售、转移、授予许可、租赁或者交换”。因此,“可辨认性”是数据要素定价和核算困难的深层原因。
数据要素为什么为存在“可辨认性”问题呢?这就需要进一步探究它的很多独特的法学和技术经济属性,以及由此带来的数据要素市场培育及价格形成困难。就法学来说,数据隐私、数据产权等等问题恐怕是近年来网络法领域最受争议的话题了,至今难有定论。而技术经济方面,至少有以下四方面重要的特征共同影响着数据要素的价格形成:其一,数据要素具有非常复杂的外部性。比如社交等领域的用户网络效应,用户画像、智能交通等领域的经济主体数据强互补性,都可能带来显著的正外部性。而资讯推荐领域的信息拥堵,以及隐私保护等问题,则可能带来较强的负外部性。实际上,整个数字经济的主导商业模式就是基于外部性基础上的交叉补贴定价,因此很多数字产品服务本身都是免费,这使得作为其背后生产要素的数据估价非常困难。其二,数据生产和使用过程涉及非常多元的主体范围。一般来说,数据要素的生产过程至少涉及感知、采集、传输、存储、计算、分析、应用、安全保障等多个环节,相关主体可能包括用户、被采集物品或服务的所有者、采集加工者、传输者、平台使用者、平台上的第三方使用者、上下游合作伙伴等等。主体范围的多元性使得数据要素的确权和定价尤为困难。其三,数据要素的准公共品属性难以确定。根据经济学理论,公共品可能会导致市场无法充分发挥作用,而纯公共品需要满足非竞争性和非排他性两个条件,否则顶多只能是准公共品。一方面,数据要素在绝大多数情况下具有完全的非竞争性。这一点是非常明显的,数据要素可以永久保存及可复制,供很多人使用也不会受到减损,从经济学意义上说就是每增加一个单位的数据要素使用量,并不会增加其他人使用的边际成本。但另一方面,数据要素的非排他性则存在不确定性。平台在一些情况下或许可以通过访问控制等方式进行排他,但数据采集的渠道通常很难排他。特别是多归属特征在互联网行业非常明显,用户往往同时使用多个同类型的服务平台,这使得长期动态来看数据排他很难实现。这些特征使得数据要素的准公共品属性难以界定,需要因时而异,从而影响其价格确定。其四,数据要素的异质性非常显著。首先,数据要素本身结构存在显著异质性,标准化的数据库只占很小一部分,现实中一段视频、一篇新闻、一条推荐都是数据,因此很难简单用TB/GB/EB等数据存储单位来统一衡量和比较;其次,数据要素搜集主体各不相同,除了互联网平台上的数据,金融部门、公共机构、科研院所、电信运营商和转型中的传统企业等主体都留存有大量数据;再次,数据要素往往以实时的流量形式存在时更有价值,而存量形式的数据价值可能会锐减;最后,数据要素的价值高度依赖使用场景,同样一条数据,在不同的企业那里,在不同的应用场景里面,边际效用及价格弹性可能都千差万别。这些异质性都使得数据要素很难有一套统一的定价公式。
经济学家周其仁在分析自然垄断行业规制定价的时候有一句名言:“没有竞争,不知成本为何物”。关于数据要素的价格形成机制,一个与此相通的逻辑是,竞争性的交易是数据要素定价的灵魂,没有交易是很难进行价格制订和价值核算的。交易有不同的形态,最普通的就是市场交易,此外还有拍卖、合作博弈等等。就普通的市场交易来说,价格形成机制通常需要三方面的力量相互作用,一个是供给方之间的竞卖,一个是需求方之间的竞买,还有一个是供需双方的博弈。由于数据要素的技术经济特殊性,关于它的生产函数、消费者行为学、供需曲线及均衡状态都与传统生产要素有质的区别。综合来看,影响数据要素定价的主要因素包括成本、收入和相对市场力量。成本方面,需要考虑数据采集、存储、传输、分析、应用和管理等环节的累计成本。比如考虑到时延性等因素,数据存储中心往往倾向于建在客户聚集的一二线大城市,但这些大城市对于数据中心的电力使用效率要求都非常高(比如PUE不高于1.4),从而使得数据存储在成本与效率方面面临艰难权衡,从而影响数据要素的价格。此外,影响数据要素定价的不只是历史成本,还得看重置成本和机会成本。由于互联网行业技术日新月异,并且用户往往同时使用多个竞争性的产品,这使得数据要素的重置成本变化非常快,从而对其定价的影响也非常大。
收入方面,需要重点考虑数据要素未来可能带来收益流的贴现,包括现金流贴现法、内部报酬率法、资本市场定价模型等各种方法。比如互联网行业常见的基于智能推荐的效果广告模式,通过统计用户的点击、下载、注册或咨询数量,分析这些行为与最终产品收益流的归因关系,就可以对数据要素进行估价。还有一种方法是对标估值方法,即如果在当前的经济体系中暂时难以评判其收入潜力,可以通过另外一个(一般来说更成熟的)经济体系中找到一个类似的产品来参考估价,比如滴滴是中国版UBER、Shopee是东南亚版京东等等,那么就可以对其拥有的数据要素进行对标估价。不管从成本方面,还是从收入方面,都只是数据要素定价的参考因素之一。实际交易中,数据拥有方总是希望在成本基础上进行更多的加成来获取经济利润,而潜在购买方则希望获取更多的消费者剩余。最终的均衡价格则取决于双方的讨价还价能力,或者说各自的相对市场力量,归根到底还是需要在具体的交易场景中才能实现。因此,通过制度设计来创造更多的交易场景是促进数据要素定价、流通和高效率配置的关键所在。在数据要素定价的基础上,我们可以对数据要素的经济价值进行统计或会计核算。目前统计界对数据的核算主要是数据库产品的增加值核算,但实际上数据要素的范畴显然远不止于此。商品的价值无外乎两方面,即产量和单价,二者相乘就是其总价值。对于数据要素而言,离开价格的单纯数量核算并没有太大的意义,这和劳动力要素的人数、技术要素的专利数等完全不一样。由此可见,对生产要素的统计或会计核算离不开定价机制,而定价机制的运转离不开具体交易场景,这与其他生产要素存在很大差别。因此,我们无法像一般生产要素那样对数据要素进行泛泛地核算,而是要抓住社交、电商、游戏、金融支付等若干典型应用场景去进行有针对性地核算,同时还需要解决数据归属地和归属主体确认等方面难题,甚至发动更多市场主体进行去中心化的统计核算,才可以比较真实、准确地看出数据要素的价值变化趋势。