数据是西方一切科学的基础,数据治理也首先起源于西方商业公司。中国传统文化中,用“道,术,器”对事物的本质进行模糊抽象总结。
华为“数据之道”之名,本身就是中西方文化的融合。更重要的是,它也体现了华为数据治理体系的内涵,乃中西合璧的产物。
在《华为数据之道》一书中,概要性介绍了华为数据治理体系。2014年,该体系经过第二次数据体系建设变革之后才最终出炉。在理解华为数据治理体系框架之前,首先要从华为鼎鼎有名的“房子图”开始说起。“房子图”来自于古希腊的雅典神庙形象,通常用来系统性的呈现一项业务模型。
- 用一句话来一目了然的展现所追求的目标或者核心的理念。
这一核心理念经过一段时间方才演变而来的。记得十几年前最开始提出时,部门领导首先站出来挑战,认为数据的重要程度并没有到战略级别,于是改成“数据是企业的核心资产”。直到后来,数据价值慢慢得到广泛认可之后,才改回成“战略资产”。政策指引是2014年才正式提出的。说实话,如果不置身其中很难理解。政策并不是”圣旨“,但让执行人无可反驳。尝试举个常见的例子来说明。在《公司数据管理总纲》章节中其中有一条:“谁产生数据,谁对数据质量负责。数据Owner负责基于使用要求制定数据质量标准,须征得关键使用部门的同意。”(摘自《华为数据之道》)这种大道理对于作为责任Owner的高层领导并不会不理解,但在此之前首先要过他所在部门的具体业务责任人。需求部门找到对方时,对方肯定希望多一事不如少一事,于是第一句话肯定是问,“公司有规定么?”此时拿出明文规定的政策,对方无话可说。如果想推脱,也得继续想办法找其他理由。华为一直以来倡导,数据管理是一项可以相对独立开展的业务,而不是像大多数人当初所理解的那样,只是IT系统的一部分。这一观念,华为也经历了一个漫长的过程才逐渐转变。在《美国国防部数据战略》一文中也有专门类似的论述:“国防部数据战略的一个核心原则是,数据不是IT资产,而是任务本身必不可少的组成部分。数据无处不在。(A core tenet of the DoD Data Strategy is the understanding that data is not an IT asset, but an essential and integral part of the mission itself. Data is ubiquitous.)”在华为数据工作的第一阶段,数据管理核心的工作主要是两项:信息架构管理和数据质量管理。被誉为”房子图“的两根柱子。中间是数据管理所服务的最终业务。已经仙逝的J先生高度抽象总结为”两纵四横“。“两纵”分别是几乎每个企业都涉及到的支持业务交易的主数据管理以及支持分析报告的维度数据管理。”四横“包含了华为公司”两大一小“的主业务流,外加从战略到执行业务流。流程:国内许多企业几乎没有流程的概念,很难理解流程的作用。华为是一家流程型运作的公司,几乎任何业务都有相应的流程来规定。业务对应的流程在企业流程架构中的层级,某种程度也体现了该项业务在公司内的重要程度。数据管理流程开始归属在企业架构流程之下,属于四级流程。经过多次变革之后,如今已经与管理变革、管理IT并列为二级流程。组织:组织包括实体部门,也包括虚拟团队(架构委员会),还有角色(数据Owner)。其中在《华为数据管理组织发展》一文中,详细介绍了实体部门。IT:有业务必有IT系统支撑。常见系统有主数据管理系统。除此以外,这几年数据治理平台慢慢开始流行,为大家所接受。当《华为数据之道》一书面世之后,好评如潮。在开始动笔写本文之初时,还有想法将华为数据治理体系框架和国际数据管理组织(DAMA)出版的DMBOK一比高下。但写到此处时,才意识到二者并无可比性。华为数据治理体系框架2007年从18M顾问公司引入。据了解,18M公司的数据管理专家也参与了DMBOK第一版编写工作,发布于2009年。可以说,本质上是同宗同源。为了写本文,我重新翻开2007年18M给华为提供的企业信息管理框架交付件。可以说,即使是到了今天,绝大部分的内容依然适用,并没有被日新月异的新技术所颠覆。在此再次向经典致敬,向我们的老师致敬。2007年,华为通过集成财务服务项目从18M引入企业数据治理体系框架:
框架只是告诉了我们要做什么事情,并不能指导我们如何做。不经过具体实践之前,很难准确判断是否合适或者好用,只有照单全收。直到后来才意识到,无论是哪个数据治理体系框架,都是从数据的视角定义了一个数据相关工作的完整视图(View)。一方面,意味着数据治理体系框架中每一个模块并不是都应该由数据管理专业组织/人员负责;另一方面,数据治理体系需要与企业已有的治理体系有机融合。在数据治理过程中,清晰的认识到上述两点至关重要。二者可以最终归结为,如何处理好数据治理与其他相关治理体系之间的关系。可惜当初我们并没有如此清晰的认识。但由于组织能力和人力有限,而且其中的一部分工作已经做得很好,至少可以先搁置不谈。数据架构(数据从产生源头,集成到ODS、EDW,再到数据集市的加工过程)、数据存储管理、信息安全,由IT部门其他部门管得好好的。在到2017年之前,数据管理组织一直没有涉入。最终我们主要选择数据模型、元数据管理(业务术语、数据标准)、数据质量模块,并尝试开始落实数据管理责任。不知道是哪位仁兄将英文Metadata翻译为元数据。我敢说,对于绝大部分中国人来说,“元数据”一词,跟翻译成“阿猫阿狗”并无二致,很难根据名称猜到所代表的实际含义。除了在数据仓库领域局部使用,华为数据领域直到2017年才才开始广泛采用“元数据”一词。那也只是机缘巧合,完全不具有代表性。后续谈到公司数据底座建设时再表。于是,将数据模型、业务术语、数据标准、信息链\数据流、数据源等管理要素统一为信息架构。与此同时,如果对外讲清楚数据治理工作,也是我们当初面临的一项非常挑战的任务。在真正开展数据工作之前,如果跟大家讲花了许多时间探索如何汇报数据工作,也许许多人会不屑一顾。而实际上,数据工作不是为了汇报,但不跟管理层汇报清楚,不被认可,就没有数据工作。完整的数据治理体系框架只是在IFS项目阶段中使用了若干次,那是有18M的顾问在后背“撑腰”,或者索性由顾问来讲。领导们一般还是比较注意礼节,即使不认同也不至于当场否决。但后来有我们自己人汇报,所受的待遇就完全不同了。记得Lucy后来跟我讲过一次汇报经历。她和Jeffery一起去向VPF汇报IFS数据项目的交付,直接被VPF从办公室轰出来了。要知道,VPF是当时是公司六大VP之一。作为基层的数据工作者,当时所承受的压力可想而知。经过几次碰壁之后,大家开始意识到,数据治理体系框架只能用于指导数据专业人员开展工作。需要采用简化版本向管理层、业务部门介绍数据工作。2011年,向从其他部门换岗来的新任CIO汇报数据工作的版本:细心的朋友可能留意到,上面的数据分类跟现在发布的数据分类框架不同,也跟业界公认的数据分类不同。实际上,华为虽然强调体系化的方法论,但绝不僵化的照搬理论。在不违反原则的前提下,强调工作和沟通的目的。直到2014年,围绕信息架构、数据质量这两个核心模块,呈现了一个相对体系化的治理体系框架。即使如此,文中开始所介绍的体系框架也并不完美。例如,流程中的“管理数据分析”与“业务模块”并没有对应关系。该流程是后来数据管理组织开始介入数据分析工作之后打的“补丁”。随着公司数字化转型变革的推进,数据工作也被推到了“风口浪尖”。公司围绕完整的数据供应链,提出了“华为数据工作建设整体框架”,其中“数据治理”变成了其中一个模块。我在上述体系框架基础上,结合其他流派的模型,尝试提出一个数据治理体系参考框架。最后,华为数据治理体系框架本身的完备性和先进性并不是决定性的。只有真正按照体系一点点实践,找到适合自己企业的环境的方式,才是关键。我想,这也是华为数据之道最核心的价值。