【金铃干货】杨巨龙:数据智能应用案例分享

2020年12月4日,由零点有数主办的以“面对难题,高举数据智能解法的大旗!”为主题的中国数据智能应用峰会暨2020第十届数据智能应用典范金铃奖颁奖盛典顺利召开,全国观众超250万人次通过多媒体平台同步观礼。

大会特别邀请了直真君智高级业务专家杨巨龙,以《数据智能应用案例分享》为主题作精彩分享。

下文整理自杨巨龙先生的演讲实录:

我今天分享的主题《大数据人才培养方式探讨》是五年来基于大数据人才培养方面的实践心得,副标题是《面向实战、强化基础、算力算法》。面向实战是指到达一线去真正了解如今的大数据工作如何展开,强化基础是指强化逻辑基础、数学基础和大数据分布式技术基础,算力是指计算机分布式集群等,而算法是面向分类、聚类、探索、预测的方法。

今天演讲的主题共分为三个部分,首先是“数字大国”向“数字强国”转型需要大数据人才;其次,互联网仍在飞速发展中,数据量依然不断增长,需要更多的人来处理数据;再次,当今唯有创新才能在激烈竞争中生存和发展。计算机出现以后经历过四个时代,首先的计算机时代只有科学家会使用,第二个是信息化时代,开始出现应用系统的开发,是给机构和组织用的,第三个是互联网时代,这是全民皆可用的时代。当前进入了一个特殊的时代,称作大数据时代,而大数据时代需要更多的大数据人才。

真正的大数据技术体系和业务体系是由大数据基础设施、大数据分析层和大数据应用层三个层面共同构成,由于这个体系的产生,也伴随着大数据算法工程师、大数据科学家、大数据应用工程师、运维工程师和安全工程师这些新岗位需求的诞生。面对该发展趋势,我国在2016年成立了数据科学和大数据专业,经过五年的发展,已经由第一批的三所高校发展到七八百所院校,这说明大数据人才非常急缺。

当前有依托高校的专门培养模式,第二种是跨学科协同培养模式,指的是数学、统计学、计算机科学跨学科的协同培养,第三种是校企协作培养模式,第四种是社会机构培养模式。但这些模式仍在探索过程中,在发展过程中出现了一些问题,一是跨领域师资队伍建设问题,二是大数据人才培养的就业和知识的定位偏差问题,三是理论实践应用统筹协调问题,四是实验设施及资源建设问题。

第二部分是一线单位大数据人才培养实践,一线单位正在使用的是一体化大数据分析平台,指的是开发、运维、应用一体化平台。大数据真正开展的工作模式叫多角色协同、并行化工作,原来的业务部门提需求,软件人员编代码,再进行测试,最终发布的工作模式已不适合大数据时代。大数据工作任务的特点是需要在不断增长和变化的数据中找到规律,实现创新,所以需要不断地探索和演进。

培训有四个部分,第一个是共同的通识培训,从业务目标倒推到业务工作职责的落实和业务角色的分工,以及如何协同工作。第二个是面向分析师的专项培训,把底层技术进行分装变成一个算子,从数据源接入数据处理、建模分析、数据可视化以及模型验证到应用发布的算子的培训。第三个是算法岗专项培训,进行解析几何、线性代数、微积分、举证、向量等统计学、数理统计的培养。第四个是开发运维岗培训,进行算子化开发的培养。

通过这种培养方式,能够达到什么效果呢?第一,能够基于分析和业务需求进行快速地开发;第二,面向专业知识不够的人群,提供了第一代码的开发;第三,分析流可以立刻发布成应用;第四,一线业务人员可进行实时查询、即席分析、算法服务。

这些是面向一线单位的培训。而面向高校的数据专业培训,提出了“实验巩固知识、实战提升性能”,实验系统和实战系统组合在一起,称为“双实”。实验系统解决的是“在哪学、学什么、怎么学”的问题,而实战系统解决“在哪用、怎么用、用在哪”的问题。在培养理念上实现一以贯之,培养“学中用、用中学”的理念,从大一到大四为每一个人提供实战化的分析平台,提供三种学习方式,包括面向数据科学、知识书本的学习方式,面向从小白到数据大牛的进阶实验,以及面向数据分析师开放实验的学习方式。

每一个场景都会提供数学知识点、实验手册、实验视频和实验试题,通过分析流拖拉拽的方式能够迅速发布成App相关的应用。培训的效果是期望能够掌握大数据技术体系,理解技术生态,了解数据科学家、业务分析人员和数据开发工程师如何协同工作,以及进行大数据分析应该掌握哪些语言和算法。

第三部分是大数据人才培养的几点心得,第一是大数据的分析,大数据工作根本在逻辑,其中包含了形式逻辑、数理逻辑和辩证逻辑。第二,大数据工作的核心是数学思想的应用,停留在第一代实用数学模型是无法发现大数据里面的规律方法的,只能转向第二代数学模型变化,把数据记录看成向量、维度。第三,大数据的价值关键在于应用,随着人们对大数据价值的认同,业务数据化、数据资产化、资产服务化、服务业务化已成为业界共识。第四,大数据的关键方法有两个,一是大数据应用需求分析方法论,二是大数据分析方法论。第五,大数据工作的手段在于工具,该工具的特点是低代码、探索式、快速迭代、算子化、可视化。

(0)

相关推荐