北京建筑大学:高校数据治理与大数据分析的思考与探索 | 封面报道
大数据的出现将颠覆传统的数据管理方式,在数据来源、数据处理方式和数据思维等方面会带来革命性的变化。高校的大数据分析,第一要务是找准大数据的源头,并真正把这些大数据收集起来,其次是找处理的平台,最后才是价值分析。
北京建筑大学从2000年开始建立MIS系统至今十余年,结构化业务数据的治理仍然是大部分高校多年来的重点、难点、痛点和顽疾。
虽然处在大数据时代,但高校大数据的采集渠道、具体内涵仍然在探索之中,而结构化数据是清晰可见的,也是最有含金量的,通过数据治理的过程,应该能为大数据时代的数据价值展现做出贡献。
高校数据治理面临的问题
目前,高校数据治理面临的严峻问题:一是业务系统过于分散。职能部处、教辅部门、学院(部)各自购买或建设业务系统,孤立的业务系统数据标准不一致、代码标准不一致,客观上造成了数据的孤岛,加大了数据清洗、整合的难度;
二是“两张皮”现象。业务系统使用与Excel管理并举,更多管理人员习惯于Excel管理。业务系统中的数据不准确、更新不及时,多科室多人头管理,岗位变动频繁,数据管理混乱;三是数据质量问题严重。数据源头上的数据质量水平层次不齐,数据质量不高是普遍事实。
此外,数据来源众多且分散,缺少真正有效整合;数据从生产到使用中间流程不清晰;数据孤岛林立,数据之间不能有效交换;数据融合困难,存在壁垒和发展不均衡;数据质量堪忧,数据的完备性、准确性存疑。
高校数据治理工作可分为以下几步:第一步是发现数据并采集,第二步是数据进行梳理与质量初检,第三步是数据标准核对与数据补充核准,第四步是数据清洗与整合交换,建立共享数据中心,第五步是数据管理与质量评估、可用服务接口设计,第六步是数据价值模型建立与展示。
数据治理的目标是提升数据质量。实现数据资源在各组织机构部门的共享,以接口方式提供任何可用数据服务。挖掘出数据的价值,可视化展示,支持决策分析。充分发挥信息化作用,用数据价值增强师生对信息化发展的信心与价值认同。
数据治理的几个关键要素包括:组织架构、业务流程、技术平台与工具、制度与标准规范。
在组织架构上,北京建筑大学设立信息化协调工作组,其中数据共享专业小组负责制定学校的整体数据架构。从管理和技术两个层面对学校数据资源进行定义,制定全校数据的标准、运维机制、分布策略和整理出《北京建筑大学业务管理数据分析报告》对数据资产心中有数梳理流程对数据的过程是必须经历的痛苦过程共享方法。
数据共享专业小组由党政办公室、组织部、研究生院、学生工作部(处)、教务处、招生就业处、科技处、人事处、财务处、资产与后勤管理处和网络信息中心等单位组成,围绕学校各业务系统的数据建设、质量分析、运维管理、交换共享、决策分析和数据验收等开展工作。
在业务流程方面,所有的数据都不是孤立的,从数据生产到数据归仓,数据的流向一定是业务流程的输入或输出,如同经络与血液。通过全方位的业务梳理,盘点数据资产(如图1所示)。
在技术平台和工具方面,实现大数据分析平台与传统业务数据管理平台交叉融合。
在制度与标准规范上,明确数据是学校的核心资产,理清每一条数据的责任人。
数据治理的核心目标是数据质量,数据质量意识是数据治理的生命线。质量意识是一所大学从领导决策层到每一个员工对质量和质量工作的认识和理解的程度,这对质量行为起着极其重要的影响和制约作用。
北建大数据治理进展及成效
在数据标准上,学校起草了新版《北京建筑大学管理信息标准》,为推进数据共享和业务系统建设提供数据规范标准,包含教职工、学生、教学、科研、财务、办公、图书、一卡通、资产、其他10个数据子集和1个学校基础情况数据子集。
在数据抽取方面,利用DCI平台,建立数据抽取转换业务。设计包含科研、研究生、图书馆、人事、一卡通、教务、办公、财务、招就、学工10个业务系统共300多个数据抽取转换业务。并根据需要配置任务执行时间及频率,通过系统对数据抽取业务实时监控。
在数据质量上,利用数据质量监控平台,实时监控数据中心集成的数据。对数据质量配置相应监控规则(如完整性、一致性、有效性等),及时发现有问题的数据。针对人事数据进行重点排查,形成数据质量报告,报告中指明了数据缺失、数据异常、数据错误等各类问题并附有详细列表,便于协同人事处对有问题数据进行进一步治理。
通过数据接口服务,向人事考核系统提供教师科研、教学工作量、指导学生等数据,实现数据有效流转,避免教师重复填写;向离校系统提供学生财务缴费、欠费数据、图书借阅、违章、欠款情况,实现业务网上办理,数据实时呈现,简化学生离校程序;建立数据抽取转换定时任务,支撑科研财务系统对接完成。
北建大数据价值模型设计了智慧校园运营多级指标体系以及相应的数据可视化运营大屏,初步实现了智慧北建大数据驾驶舱,包含综合校情、师资科研、学生成长服务等模型(图2、3为相关实例)。
综上,北建大数据治理初见成效,初步建立了《管理信息标准》和共享数据中心。学校注重数据服务接口建设,保证共享数据中心的可用性。在数据治理过程中发现了很多散落的数据,逐步梳理收集归仓。数据治理过程提升了数据质量,数据的价值模型、价值发现在同步建设和研讨中,同时,数据治理还不够深入,需要不断迭代优化,需要进一步提升数据质量。
同时,要做好大数据分析,还需要做好以下几点:
第一,要在数据源头采集上下功夫,拓展大数据分析之外的工作,数据采集工作很重要,已有的要采集归仓,没有的要实现采集;
第二,加强网络流量分析、网络日志分析、图书文献资源检索分析、图书馆门禁分析等;
第三,结构化数据治理与非结构化数据都要重视,更要重视结构化数据分析;
第四,了解学校最关心什么:教师和学生。教师是否在认真教书育人?学生是否在认真学习?所有的管理工作都是为这两点服务的。大数据分析应该从学校最关心的业务点着手,才会有的放矢。
未来,北建大将建设真正完全交换、可用的全量数据管理中心,数据为流程服务,流程促进数据价值;继续收集梳理非结构化数据、结构化数据;通过结构化数据+非结构化数据+大数据分析平台,寻找大数据的价值;建设综合校情实时分析平台,为各级各类领导提供决策支持。
(作者系北京建筑大学网络信息管理服务中心主任)
本文刊载于《中国教育网络》杂志2017年10月刊