《中国教育网络》知识图谱分析
2020年,面对突如其来的新冠疫情,高校响应“停课不停教,停课不停学”的号召,推出了在线教学平台,并为响应国家疫情防控要求,推出健康打卡小程序记录师生健康状况,上线校门出入申请流程,严格做好人员健康检测。
这些应急措施,无一不借助信息化技术来支撑,也充分证明了信息化的赋能作用。而信息化技术不仅依靠本校信息化人的努力,还需借鉴其他高校信息化的智慧结晶,所以互相交流和学习是信息化快速有效发展的必要手段。
为充分研究高校信息化近几年的发展趋势,方便高校信息化人了解信息化领域的动向和兄弟院校的工作重点,本研究对《中国教育网络》中的文章做了知识图谱分析。
《中国教育网络》杂志立足教育网络,服务于教育信息化,解读国家信息化发展政策,全面报道中国教育网络建设现状及成就,研讨教育网络建设的经验与问题,记录围绕教育信息化的重大应用及事件。因此,分析该期刊发表的文章,可以得出客观真实的信息化发展热点和前沿趋势。
基于此,本研究以CNKI数据库中《中国教育网络》近三年的文章作为样本,并综合运用CiteSpace、VOSviewer等多种文献计量工具将文章数据信息进行计量分析并转化成可视化图像,拟对高校信息化发展概貌有较全面的认识。
本研究尝试从时间分布、作者分布和关键词分布等三个方面探究高校信息化发展的能量分布,从研究热点内容、前沿趋势等方面综合梳理高校信息化发展重点分布,并在此基础上总结研究结论,展望未来发展趋势。
相较于既有文献,本研究的贡献之处主要在于:
1.研究方法上,相比于既有研究的阅读量等定量分析,本研究基于该刊内容并运用文献计量和知识图谱的方法综合性梳理了各高校的发展成果,研究方法和所得结论更具科学说服力;
2.研究工具上,现有知识图谱相关研究成果多使用单一工具,本研究则综合运用CiteSpace、VOSviewer等多种文献计量工具,克服单一工具的弊端;
3.研究内容和视角上,本研究从关键词分布、研究热点前沿趋势等多维度、多视角综合梳理探究高校信息化发展成果,并在此基础上提出未来研究方向展望。研究所得成果结论可以为后续工作提供方向引导。
研究设计
为确保研究样本文献准确性,本研究从CNKI知识库中选取《中国教育网络》2018年1月份至2020年9月份的期刊文章,初步得到1345篇文章。在此基础上,对文章的题目、关键词做人工筛查,手动剔除资讯类等文章,最终得到共计945篇文章。
VOSviewer在作者、机构、期刊等能量分布,以及文献被引的分析结果精确程度总体高于CiteSpace,其密度视图直观显示了研究领域的热点内容。
CiteSpace则可较好地通过时区视图、时间线视图等展示研究领域的演进脉络和全景概况,其突发性探测则能分析研究前沿趋势。因此,本研究综合运用两种可视化软件以互补,从而更好地揭示文章数据背后的“真相”。
作者分布
作者分布特征有助于了解高校信息化领域的成果主体能量分布,且可由作者耦合分布特点揭示该领域高影响力、高产量作者群体及其合作互动关系。利用VOSviewer和CiteSpace软件对研究样本进行作者分布处理,可得如图1所示的作者分布知识图谱。
图1 作者分布
由图1可知,945篇样本文章共涉及806位作者,其中发文前三的作者有张登科(8篇)、沈阳(7篇)、涂庆华(6篇)、王玉平(6篇)。发文量5篇及以上的作者共计13位(不含编辑人员),发文量2篇及以上的作者共计210位(不含编辑人员)。
通过图1也可以看出,该刊文章作者的共耦性比较低,互相之间没有较强的联系,这也说明学校之间的成果合作比较少,符合目前的信息化建设现状。
研究显示,大部分作者在2018年就已经开始发表文章,在后续的2019年逐步出现新的作者,如赵衍(2019年开始)、张紫徽(2020年开始)。
图2 发文作者机构分布
从作者机构分布来看,如图2所示,共涉及251个机构,去掉中国教育网络(223篇)、中国教育和科研计算机网应急响应组(22篇)外,发文量最多的机构是浙江大学信息技术中心(9篇)、中国科学技术大学网络信息中心(7篇)、复旦大学校园信息化办公室(7篇)、大连理工大学网络与信息中心(7篇)、清华大学电机系(7篇)、中国人民大学(6篇)、上海交通大学(6篇)、上海海事大学信息化办公室(6篇)。
从作者地域分布来看,信息化文章发文较多的区域主要集中在北京市、上海市、安徽省、浙江省、辽宁省等省市。
研究热点内容
样本文献的关键词词频和共现网络分布有助于揭示过往三年高校信息化领域的热点主题,而时间线视图则可以反映出该领域各聚类热点时间跨度及其演化历程。945篇文章共涉及2721个关键词,研究发现共现频次5次及以上的关键词共计154个。因本刊主题为教育信息化、CERNET,因此去掉了这两个关键词。
图4 关键词聚类
在图4中VOSviewer将关键词划分为8个聚类。其中共现频次达到20次及以上的关键词主要有下一代互联网(51次)、人工智能(38次)、教育网络(32次)、智慧校园建设(31次)、在线教学(30次)、网络安全(29次)、校园网(28次)、攻击者(28次)、中国教育和科研计算机网(26次)、高校信息化(24次)、智慧校园(23次)、疫情防控(20次)、教育部(20次)、在线教育(20次),此外近年热点的关键词还有线上教学(19次)、进行聚类,可以得出图5所示的聚类图谱。
图5 关键词聚类时间线视图
CiteSpace共生成29个聚类,图5仅显示了17个聚类。切换成时间视图,可以清晰地看到聚类有CERNET、北京邮电大学、智慧校园、攻击者、校园一卡通系统、教育信息化、EDUCAUSE,统一身份认证、网络空间、根服务器、校园网络、信息技术中心、教育网络、线上教学、流程引擎、一站式服务、图书馆数据等。
总体来看,高校信息化内容逐步从传统的硬件建设和孤立的系统建设,转向基础系统化建设和以应用为主的系统化建设,以及应对疫情防控和“停课不停教学”的信息化建设。
通过线上教学、一站式服务等时间线的颜色可以看出,该类建设早在2018年就已经开始,这也说明应对疫情的信息化设施和技术准备不是一蹴而就的,需要长时间的探索和准备。需要注意的是,在2020年的聚类中统一认证仍然是共现较多的关键词,这既源于CARSI的使用,也缘于零信任安全网络架构的应用。
图6 关键词共现时间分布
通过图6所示的关键词共现时间分布图可以看出,偏黄色的是最新的关键词,也就是在线教学、线上教学、疫情防控、在线教育、信息化部门、基础平台等关键词。这也缘于2020年的新冠疫情防控带来的变化,并与CiteSpace所作的关键词聚类时间线视图相一致。
高校信息化发展趋势
高校信息化迷途可表征该领域的焦点议题和建设现状,揭示该领域最新前沿趋势有助于高校预判未来发展动向,及时做好技术准备。VOSviewer对关键词进行分析发现,下一代互联网、人工智能、智慧校园建设、高校信息化都是热点,这也是目前各高校需要参照对比的依据。通过对比,可以及时采取措施补短板、强长板,以满足师生需要。
图7 百度搜索指数
同时,结合百度搜索指数及业界流行的关键词来看,网上办事中心(或者一站式服务)、疫情防控、在线教学类的文章处于起步阶段,而数据治理、一体化、治理体系和治理能力等关键词都未显现,更是说明这些领域的治理刚刚萌芽,后续信息化人可以多撰写这些领域的文章,高校也可以聚焦这几个领域进行规划和建设。
本研究以2018年1月份至2020年9月份的《中国教育网络》期刊文章作为研究样本,综合运用CiteSpace、VOSviewer等知识图谱工具,系统性梳理探究了高校信息化研究能量作者分布、机构分布、时间分布和关键词分析,所得主要研究结论可供高校信息化从业人员参考,与本校信息化建设现状进行对比,以更科学地制定建设规划和方案。
作者:王玉平、李萌(上海海事大学)