深度||我国农业信息数据体系特征、参考价值及可得性评估

布瑞克农业数据

1.国内农业信息数据体系综述

农产品价格监管与预警体系的建设,离不开对现有农业信息资源基础的整合,对中国农产品市场信息基础体系的调研和分析是本课题的一个重要方面。

按照农业市场信息数据来源的机构是政府及相关单位、私营机构,可以将信息数据分为公共信息数据和商业信息数据,公共信息数据属于公共产品,一般免费向公众提供,而商业信息数据则由市场化的专业公司提供,一般需要购买才能获得。

按照农业市场信息数据所对应的农产品和服务,可以将农业信息数据划分为不同的产业体系数据。根据农业部对现有农产品产业体系的规划,从2007年以来,我国陆续开展了50个现代农业产业技术体系,涉及34个作物产品、11个畜产品、5个水产品,那么农业信息数据可以细分为水稻产业数据体系、玉米产业数据体系、小麦产业数据体系、大豆产业数据体系、油菜产业数据体系、棉花产业数据体系、柑橘产业数据体系、苹果产业数据体系、生猪产业数据体系、奶牛产业数据体系、蔬菜产业数据体系等。

而从对现有农业数据体系的深入调研来看,我国农产品市场信息体系的几个重要的特征简摘如下:

A)缺乏顶层标准,公共信息数据开放性不足,数据开放共享体系待完善;

数据开放性主要是针对作为公共产品的农业公共信息数据而言,除了部分数据的涉及国家安全及为政策效果考虑,大部分信息数据理论上是可获取的,然而从实际效果而言,数据获取的渠道不畅,获取成本高昂。农业部下属事业单位中国农业科学院在构建的国家农业数据共享体系方面做出了尝试,实际运作的效果不理想。究其原因,则是相关部门只注重部门利益,将本应免费发布的数据,多以纸质年鉴的形式对外发售,而不是采用类似美国农业部的近乎免费的电子数字信息渠道,大大增加获取信息数据的难度和成本。近两年来,随着大数据战略越来越重要,数据开放共享,以促进大数据产业的发展的呼声越来越强,中国政府2015年8月31日发布《促进大数据发展行动纲要》中,明确规定要大力推动政府部门数据共享、稳步推动公共数据资源开放。可以预见,在未来的3-5年内,农业公共信息数据的开放性将得到极大提高,数据获取的成本大幅降低。

B)、农业信息数据资源爆炸性增长,对信息数据管理未到位;

随着农业投资的不断增加,互联网和计算机技术的普及,和其他领域的信息数据资源一样,农业信息数据资源的数量爆炸性增长,尤其是生物信息数据呈指数式增长,但是我国农业信息数据发展的时间短,相关部门的数据管理经验不足,在基础设施和思想准备方面,对农业信息数据的增长准备不足,使得对农业信息数据的管理相对落后,在一定程度上制约了农业信息数据的健康、快速发展。

C)、农业信息数据资源生产仍以政府为主体,私营机构发展迅猛;

我国农业信息数据资源,从2000年以前基本上是以政府数据体系为主,2000年后,随着农业投资的不断增加,私营的农业生物科技公司、农业信息咨询机构等农业信息资源生产主体迅猛发展,特别是在农业经济类信息数据资源方面,在数据的及时性、数据报表及可视化以及数据挖掘等方面对整个农业信息数据体系进行了很好的补充。未来,以政府为主体,或者以政府购买私营机构的信息数据资源服务为主,激活信息数据资源生产市场。农业部市场与经济信息司副司长王小兵近日表示,未来要培育多种主体,充分利用好电商平台大数据,调节农产品生产和消费,构建农业大数据体系。

D)、农业信息数据时效性较差,深度挖掘及利用不足

随着对农业投资越来越重视,特别是农业金融市场的不断发展,对农业信息数据的需求越来越大,使得我国现有的农业信息数据的时效性大大提高,但是相比与美国、加拿大等国家的数据发布的时效性来看,我国仍有很大差距,以美国农业部的供需数据为例,数据的发布精确到分秒,数据的统计标准完善,时序较长,数据发布后对全球大宗产品市场供需关系会产生重大影响,对天气、生长状况、价格、产销及其他相关数据对于金融市场和政府决策会产生可预期的影响。而我国的农业社会经济信息数据发布仍不及时,数据发布审核的过程繁琐冗长,时序性较短,统计标准不断转换,使得在数据挖掘及建模过程中的,可利用的有效数据不足。

E)、农业信息数据统计标准的科学性及信息数据质量有待提高

农业信息数据的质量,除了受限于现有的科研认知水平、经济条件,还受人员素质、各种制度安排等方面因素的影响。由于我国农业信息数据发展时间短,外加在初期在对农业信息数据的重要性认识不足,在整个标准设计方面,缺少科学性、长期性的规划,外加人员素质参差不齐,使得某些方面的农业信息数据资源质量较差,需要在行政制度、统计制度和方法等方面不断完善。

2.国内农产品各类信源数据特征及参考价值评估

对信息数据评价主要采取以下四个特征指标:及时性、真实性、准确性、完整性[1]。

在政府信息数据方面,由于政府结构在人力、智力和财力方面的巨大优势,以及较为完善和科学的信息数据生产和加工制度和方法,使得政府信息数据在数据完整性、真实性和准确性方面都领先于商业信息数据,但是在数据的及时性方面相比于商业信息数据则有所不足。

鉴于信息数据在政策产生、执行和检验的过程中起着重要作用,那么政府部门为达到相关政策效果或者推行某项政策,还包括在科研活动中,存在篡改数据或者故意修改数据指标的行为,这种现象无论在国内还是国外都在一定范围内存在。

而对商业性信息数据而言,虽然在数据的完整性方面与政府信息数据存在很大差距,但是无论自然资源环境信息数据、生物信息数据还是社会经济信息数据方面,数据的及时性、准确性是这些商业性数据公司得以存活的主要原因,因此在人力和物力资源相对不占优的情况下,通过市场和私营机构的效率,在及时性方面能够领先于政府信息数据,在真实性和准确性方面也能够达到较高的分数。

从具体公共农产品市场信息机构来看:

农业部作为农业市场信息数据体系的主体机构和主管机构,自身基本拥有政策信息数据、集贸市场价格数据、47种重点农产品批发市场价格和交易量数据、全国数千个样本点的农产品生产信息数据等,信息数据的完整性、真实性和准确性很高,随着信息发布制度的逐步完善,信息发布的及时性也大大提高。

科研院所方面,主要产出的是农产品市场科研信息及数据,这类信息数据的时效性不大,完整性方面表现也较差,但是在准确性和真实性方面表现优秀,特别是在信息数据的挖掘应用方面,主要应用场景为政府决策服务,也有部分研究成果和数据为市场交易和决策服务。

海关总署发布有所有农产品的进出口贸易数据,数据的及时性、准确性、真实性、完整性非常高。

国家统计局侧重于生产信息和价格信息,生产信息中包括产量信息、生成成本收益信息,部分信息来源与农业部有交叉,价格信息方面偏重于生产者价格,形式上偏重于价格指数,使得价格数据在准确性和完整性方面很好。此外,在市场价格方面,除了吸收农业部等其他机构数据,统计局还和其他咨询机构合作,将部分机构数据整合统计局对重点农产品的监测中去,定期对外进行发布,提高了统计局数据的完整性,随着统计信息发布制度的逐渐完善,发布的及时性大大提高,统计发布日历,可以让受众掌握该数据发布的日期和时点,对信息数据的预期作用会大大提高。

气象局发布的是农业气象市场信息数据,该数据包括降水、温度、光照、辐射、风速等气象指标,对于农产品产量、质量的预测以及贸易流通等都有重要的影响,由于广布的气象站点及完善的信息发布制度,这类数据在及时性、准确性、真实性和完整性方面都很高。

商务部主要是农产品批发市场价格数据,所采集数据源与农业部有交叉重叠,同时还要国外的农产品市场信息数据,及时性、准确性和真实性方面表现较好,但完整性的表现要逊色一些。

期货交易所发布的是大宗农产品的期货市场的交易数据,期货交易所涉及郑州商品交易所和大连商品交易所,涉及农产品有稻谷、小麦和玉米灯谷物类,也有豆油、菜油和棕榈油等油脂类,豆粕、菜粕等饲料原料及棉花和白糖软商品,交易数据包括开盘价、最高价、最低价、收盘价、结算价、交易量和持仓量等交易信息数据,在数据及时性、准确性和真实性方面表现非常好。完整性方面似乎还有一定发展空间,尤其是对于畜产品的覆盖。

大宗商品交易中心是除了包括期货交易市场商品,还包括未在期货市场交易的其他农产品品种,大宗商品交易中心既有电子盘交易,也有现货市场电子盘交易,具体的信息数据类型与期货交易类似,虽然在完整性方面对期货交易所进行了很大的补充,但是数据的准确性和真实性方面要弱于交易所数据。

证券交易所生产和发布的农产品信息主要是涉农企业的股票市场交易数据,与期货交易产生的数据类似,在及时性方面表现较差,但是由于我国股市交易制度等方面的缺陷,交易数据的准确性、真实性常受到质疑,且数据只涵盖上市公司,对企业层次的信息来说,完整性略有不足。

各类农业相关的行业协会通常在组织协调本类会员企业的过程中,会积累较多本行业的数据信息,与上述各类数据比起来,行业协会的数据真实性较高,且数据层级偏向微观,有大量产地级甚至企业级的数据信息,参考较之很高,但由于缺乏统一的标准和规划,数据信息的持续性并不算好。

从具体商业性农场品市场信息机构来看:

农业信息数据咨询公司提供的是农产品市场及时性资讯消息、产品市场行情及政策的深度分析、整合的公共机构信息数据及独家监测的农产品市场运行数据,包括农产品的阶段性生产情况(周度、月度、年度等)、库存、价格、交易量等,在及时性方面表现非常优秀,准确性和真实性方面,由于缺少相关行业制度,全凭企业自律,但是部分农业信息咨询机构在市场的检验中成长,在市场竞争的压力下不断改进,数据的真实性也比较高,但是由于企业自身经济实力的局限,数据的完整性较差。

农产品电商平台所生产的信息数据是农产品的交易价格、交易量、库存、贸易流向、消费人群、消费区域等诸多信息。农产品电商平台,既包括京东商城和天猫商城等综合性电商平台,也包括我买网、天天果园、农牧人等纯农业电商平台。单一电商平台有产品数量的局限,但是就整个农产品电商平台而言,基本覆盖所有农产品,及时性、准确性和真实性方面表现较好。

涉农门户新闻信息网站主要提供的是零散的大量的农产市场信息数据,及时性方面表现优秀,但在真实性、准确性和完整性方面表现较差。

单个的批发市场及其他个体信息生产者,作为整个市场信息生产的最基础单元,在及时性、真实性和准确性方面表现较好,单一信息生产者完整性较差。

3.国内农产品各类信源数据的可获得性评估

信息数据的可获得性主要强调的是信息数据的开放性,这主要关注的是公共农产品市场信息机构,商业性农场品市场信息机构基本上是对所有人开放,只是这种可获得性可能带有不同程度的获取成本。而公共农产品市场信息机构在某些数据方面,是不对外开放的,只是决策机构可以获得。

持续纳入监测体系的成本评估包括获取数据的直接成本和维护的间接成本。前提是信息数据来源能够持续提供信息数据,除了指标沿用具有可持续性外,信息生产机构,特别商业性机构,市场化运作难免会有兴衰存亡。直接成本指的是信息数据来源是否是免费的还是付费的,维护的间接成本则包括人力成本及其他物质成本,这取决于信息数据的数量和质量,同时与信息数据的发布方式及挖掘分析深度等密切相关。

从公共农产品市场信息机构来看:

农业部信息参考价值非常高,但整体开放性一般,对于已经开放的信息数据持续监测的成本很低。

科研院所方面,农产品市场科研信息及数据参考价值一般,数据开放性较差,一般只为决策机构服务,持续监测成本非常高。

海关总署发布有所有农产品的进出口贸易数据,数据的参考价值非常高,特别是对于大豆等进口量比较大的农产品,数据的开放性很好,但是海关数据并非全部免费,涉及到较为详细的企业层面进口数据,基本是收费的,而且费用较高。

国家统计局数据基本都是免费的,但是由于部分重要数据发布较延迟,使得数据参考价值大打折扣,但总体参考价值仍较高,开放性非常好,随着统计资料得电子化,数据获取成本大大下降。

气象局发布的是农业气象市场信息数据,参考价值较高,特别是对于农作物品种。基本的信息数据在相关网站都可以获取,开放性较好。但是涉及到详细、长序列的气象数据则需要购买,持续监测的成本较高。

商务部主要是农产品批发市场价格数据,参考价值一般,数据开放性很好,数据获取成本低。

期货交易所发布的是大宗农产品的期货市场的交易数据,对于农产品市场参考价值非常大,主要是由于农产品生产和消费的特点,农产品期现货结合越来越密切,对期货交易数据的需求越来越大。由于制度要求数据开放,数据的开放性非常好,而且电子化的数据,数据获取的成本非常低。

大宗商品交易中心数据参考价值较高,数据开放性较好,相较于期货交易数据,部分数据需购买,获 取成本较低。

证券交易所生产和发布的农产品信息主要是涉农企业的股票市场交易数据,数据的参考价值较高,数据的开放性较好,获取的成本较低。

从商业性农场品市场信息机构来看:

农业信息数据商业公司所提供的信息数据,由于具有较强的针对性和操作性,参考价值很高。除了部分面对特定客户对象的数据产品,开放性很好,但是信息数据获取的成本非常高。

农产品电商平台信息数据参考价值较好,但是开放性一般,部分交易数据属于公司的内部消息,不便对外发布,整体获取的成本较高。

涉农门户新闻信息网站所提供的农产品市场信息数据,参考价值一般,开放性非常好,获取成本较低。

单个的批发市场及其他个体生产者的农产品市场信息数据,参考价值和数据开放性一般,获取成本较高。

注:

及时性是指农业信息数据的发布在合理的时间范围内,按时发布。主要是不同频度的数据,及时同步显示的、分、时、天、周、旬、月、季、半年、年、一个活动周期等,在合理允许的收集、统计核算、修正的时间后,能够在约定的时间发布,使得受众能够在极短时间内对数据进行可视化及挖掘分析,以供决策使用。

真实性是指农业信息数据的生产者必须具备一定的数理统计及相关专业知识,本着实事求是的原则,严格遵守相关工作规范、标准,忠实于实验,忠实于调研,不弄虚作假,删改和编造信息数据。

准确性:准确性与真实性紧密相关,真实性是准确性的基础,但是真实的数据不一定准确。准确性则更多的与数据指标设计的科学性和代表性、实验设计的科学性和代表性,制度不完善,具体表现为数据指标设计存在明显的逻辑错误,数据拼凑,统一指标在不同时期的统计范围、口径、内容、方法、单位及数值上有差别造成数据的不可比性。

完整性:指的是数据覆盖范围,主要是品种、数据属性、空间和时间等,就是要尽可能地覆盖所有品种、区域与时间范围,基础数据的完整性,将在很大程度上影响数据挖掘及决策的结果。

文末可以留言评论哦!

原创申明:本文由布瑞克农业数据原创,@2015 布瑞克保留所有权利

客服电话:010-57402020

(0)

相关推荐