工业大数据是智能制造的核心,以“大数据+工业互联网”为基础,用云计算、大数据、物联网、人工智能等技术引领工业生产方式的变革,拉动工业经济的创新发展。工业大数据分析技术作为工业大数据的核心技术之一,可使工业大数据产品具备海量数据的挖掘能力、多源数据的集成能力、多类型知识的建模能力、多业务场景的分析能力、多领域知识的发掘能力等,对驱动企业业务创新和转型升级具有重大的作用。工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库 存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节产生的各类数据及相关技术和应用的总称。其以产品数据为核心,极大延展了传统工业数据的范围,同时还包括工业大数据相关技术和应用。工业大数据的主要来源有如下3类。
生产经营相关业务数据主要来自于传统企业信息化范围,存储在企业信息系统 内 部,包 括 传 统 工业设计和制造 类软件、企业资源计划(ERP)、产品生命周期管理(P L M)、供 应 链 管 理(S CM)、客户关 系管 理(CRM)和环境管理系统(EMS)等。这些企业信息系统已累积了大量的产品研发数据、生产性数据、经营性数据、客户信息数据、物流供应数据及环境数据。此类数据是工业领域传统的数据资产,在移动互联网等新技术应用环境下正在逐步扩大范围。
设备物联数据主要指工业生产设备和目标产品在物联网运行模式下,实时产生收集的涵盖操作和运行情况、工况状态、环境参数等体现设备和产品运行状态的数据。此类数据是工业大数据新的、增长最快的来源。狭义的工业大数据即指该类数据,即工业设备和产品快速产生且存在时间序列差异的大量数据。
外部数据指与工业企业生产活动和产品相关的企业外部互联网来源数据,例如,评价企业环境绩效的环境法规、预测产品市场的宏观社会经济数据等。工业大数据技术是使工业大数据中蕴含的价值得以挖掘和展现的一系列技术与方法,包括数据规划、采集、预处理、存储、分析挖掘、可视化和智能控制等。工业大数据应用则是对特定的工业大数据集,集成应用工业大数据系列技术与方法,获得有价值信息的过程。工业大数据技术的研究与突破,其本质目标就是从复杂的数据集中发现新的模式与知识,挖掘得到有价值的新信息,从而促进制造型企业的产品创新,提升经营水平和生产运作效率以及拓展新型商业模式。
工业大数据特征
工业大数据除具有一般大数据的特征(数据容量大、多样、快速和价值密度低)外,还具有时序性、强关联性、准确性、闭环性等特征。
数据容量大(volume):数据的大小决定所考虑的数据的价值和潜在的信息。工业数据体量比较大,大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级甚至EB级别。
多样(variety):指数据类型的多样性和来源广泛。工业数据分布广泛,分布于机器设备、工业产品、管理系统、互联网等各个环节,并且结构复杂,既有结构化和半结构化的传感数据,也有非结构化数据。
快速(velocity):指获得和处理数据的速度。工业数据处理速度需求多样,生产现场级要求分析时限达到毫秒级,管理与决策应用需要支持交互式或批量数据分析。
价值密度低(value):工业大数据更强调用户价值驱动和数据本身的可用性,包括:提升创新能力和生产经营效率及促进个性化定制、服务化转型等智能制造新模式变革。
时序性(sequence):工业大数据具有较强的时序性,如订单、设备状态数据等。
强关联性(strong-relevance):一方面,产品生命周期同一阶段的数据具有强关联性,如产品零部件组成、工况、设备状态、维修情况、零部件补充采购等;另一方面,产品生命周期的研发设计、生产、服务等不同环节的数据之间需要进行关联。
准确性(accuracy):主要指数据的真实性、完整性和可靠性,更加关注数据质量以及处理、分析技术和方法的可靠性。对数据分析的置信度要求较高,仅依靠统计相关性分析不足以支撑故障诊断、预测预警等工业应用,需要将物理模型与数据模型结合,挖掘因果关系。
闭环性(closed-loop):包括产品全生命周期横向过程中数据链条的封闭和关联以及智能制造纵向数据采集和处理过程中,需要支撑状态感知、分析、反馈、控制等闭环场景下的动态持续调整和优化。
由于以上特征,工业大数据作为大数据的一个应用行业,在具有广阔应用前景的同时,对传统的数据管理技术与数据分析技术也提出了很大的挑战。
工业大数据架构包含3个维度:生命周期与价值流、企业纵向层和IT价值链,如图1所示。在生命周期与价值流层,按照工业大数据的应用领域,又可分成产品生产阶段开始前的产品研发与设计、产品交付前的生产与供应链管理及产品交付后的运维与服务管理3个领域。在企业纵向层,按照数据采集方式与应用层级又可分成信息物理系统层、企业管理信息系统层及平台互联系统层。在IT价值链层,又可分成业务架构、信息系统架构及IT技术架构3个层次,其中信息系统架构又可分为应用架构及信息架构。
工业大数据架构中的生命周期与价值流维度涵盖了整个产品生命周期的各阶段,即研发与设计、生产、物流、销售、运维与服务5个阶段,其中,生产、物流和销售可进一步归类于生产与供应链领域,则生命周期与价值流维度包含了3个领域:研发与设计、生产与供应链及运维与服务3个领域,各领域的应用场景如图2所示。
研发与设计领域
研发数据通过研发人员在研发设计过程中不断积累而成,其来源于产品生命周期各个环节,包括:用户需求大数据、研发知识大数据、产品重用大数据、研发协同大数据等,具有跨产品和跨行业、种类繁多的特性。
- 实现客户参与的个性化产品定制设计 企业通过互联网平台能够收集用户的个性化产品需求、产品的客户交互和交易数据。挖掘和分析这些客户动态数据,能帮助客户参与产品的需求分析和产品设计等活动中,实现定制化设计,再依托柔性化的生产流程,就能为用户生产出量身定做的产品。
- 实现基于大数据的模拟仿真设计 传统生产企业在测试、验证环节需要生产出实物来评测其性能等指标,成本随测试次数的增加而不断提升。利用虚拟仿真技术,可以实现对原有研发设计环节过程的模拟、分析、评估、验证和优化,从而减少工程更改量,优化生产工艺,降低成本和能耗。
- 实现基于大数据的个性化定制设计自动化 传统企业产品种类、式样不多,可采用手工设计产品模型、生产样品,再进行量产的生产模式,但面对个性化、小批量生产的要求,传统模式将导致产品生产周期过长、成本过高。通过积累大量的产品设计模型数据,分析设计数据之间的关联,借助大数据技术及其他辅助设计工具可实现个性化定制设计及模型生成的自动化。
- 促进研发资源集成共享和创新协同设计 企业通过建设和完善研发设计知识库,促进数字化图纸、标准零部件库等设计数据在企业内部以及供应链上下游企业间的资源共享和创新协同,提升企业跨区域研发资源统筹管理和产业链协同设计能力。提升企业管理利用全球研发资源能力,优化重组研发流程,提高研发效率。
- 培育研发新模式 基于设计资源的社会化共享和参与,企业能够立足自身研发需求开展众创、众包等研发新模式,提升企业利用社会化创新和资金资源能力。
生产大数据不仅包括产品生产制造过程中采集的产品生产信息、订单信息、设备信息、控制信息、物料信息、人员工作排程,还包括企业内部管理信息流、资金流、产品生产上下游的供应商及客户管理等相关辅助生产管理的信息,生产数据的采集依托于企业已有资源管理、制造执行、工控管理、供应链管理、供应商管理、客户管理、商务管理等信息系统。
实现生产过程实时监控与管理及生产设备预测性维护,提升生产过程及设备管理水平,优化生产流程,并提升产品质量。 现代化工业制造生产线安装有数以千计的小型传感器,探测生产设备的工作状态,如温度、压力、热能、振动和噪声等,利用这些数据可实现生产过程实时监控、设备故障诊断与预测、能耗分析、质量事故分析等。此外,还可将生产制造各个环节的数据整合集聚,对生产过程建立虚拟模型,仿真并优化生产流程。
实现个性化定制规模生产,推动现代化生产体系的建立。通过产品全生命周期内数据流转的自动化及对制造生产全过程的自动化控制和智能化控制,将促进信息共享、系统整合和业务协同,提高精准制造、高端制造、敏捷制造的能力,实现个性化定制规模生产,加速智能车间、智能工厂等现代化生产体系建立,实现智能生产。
实现网络化协同制造及制造业共享经济。通过“互联网+”,进行生产资源在企业内或企业间的整合优化,实现企业内部的纵向协同制造或企业间的横向协同制造。通过互联网+共享经济,进行创新资源、生产能力、库存等生产资源的共享,实现制造业共享经济。
优化工业供应链。射频识别(RFID)等电子标识技术、物联网技术以及移动互联网技术能帮助工业企业获得完整的产品供应链的大数据,利用这些数据进行分析,将带来仓储、配送、销售效率的大幅提升和
成本的大幅下降。跟踪产品库存和销售价格,而且准确地预测全球不同区域的需求,从而运用数据分析得到更好的决策,优化供应链。
实现需求预测,以便更好地安排进货、生产,当需求下降时,可追溯问题原因,并解决问题。
实现客户画像与精准营销以及客户行为分析,可扩展客源,提升营销成功率及原有客户的满意度及忠诚度。
运维与服务领域的数据来源有很多,主要包括:在客户允许的情况下,通过嵌在产品中的传感器采集的产品实时运行状态数据及周边环境数据;通过商务平台获得的产品销售数据、客户数据及相应的产品评价或使用反馈;客户投诉及相应处理记录;产品退货/返修记录及相应的维修记录。通过对这些数据进行分析、挖掘及预测,可帮助工业企业不断创新产品和服务,发展新的商业模式。
- 通过监控、分析远程采集的产品实时运行状态数据,实现远程监控与管理、故障诊断及预测性维护等在线增值服务,可降低维护成本,提高产品利用率。
- 通过分析设备的客户使用数据及周边环境数据,还可为用户提供延伸服务,扩展产品价值空间,实现以产品为核心的经营模式向“制造+服务”的模式转变。
- 通过分析客户产品评价或使用反馈、客户投诉,将有用的意见融入产品的设计及产品改进中,对客户投诉进行分类处理,可提高产品质量及售后服务质量,降低投诉率,提高客户满意度及忠诚度。
- 通过分析产品退货或返修原因,及时采取有效措施,可提升产品质量,降低退货率及返修率。
工业大数据架构的企业纵向层从物理域的角度自下而上共分为5层,分别为设备层、控制层、车间层、企业层和协同层。在设备层、控制层、车间层可利用物联网,基于信息物理系统实现智能工厂;在企业层,企业集成内部各种信息化应用,进行企业内部业务流程整合和改造,提升企业运行效率;协同层使用工业云等平台技术,实现企业外部协同制造及制造业服务化等创新业务模式。企业纵向维度可以分成信息物理系统、企业管理信息系统、互联平台系统3个子系统
信息物理系统通过传感器和各类信息系统采集和汇聚机器运转数据、生产现场数据,实现泛在感知,并运用数据集成处理技术,对工业数据进行采集交换、生产制造反馈控制,达到对设备、车间的控制交互,实现工厂内外物理系统的互联互通,也为工业建模/仿真与分析提供数据基础,进而为车间/工厂运营决策优化提供支撑服务。在工业大数据架构企业纵向层中,用于对工业设备层进行信息采集的信息物理系统以大数据、网络与海量计算为依托,通过核心的智能感知、分析、挖掘、评估、预测、优化、协同等技术手段,使计算、通信、控制实现有机融合与深度合作,做到工业设备、环境、群体的网络空间与实体空间的深度融合。信息物理系统本质在于将物理设备连接到互联网上,让物理设备具有计算、通信、精确控制、远程协调和自治五大功能。
企业信息化就是企业应用信息技术及产品的过程,企业信息化是信息技术由局部到全局、由战术层次到战略层次向企业全面渗透,运用于流程管理、支持企业经营管理的过程。企业信息化主要涉及生产过程控制、企业管理、产品生命周期管理、供应链优化管理等过程。生产过程控制信息化的重点是产品开发设计、生产工艺流程、车间现场管理、质量检验等各设计、生产环节。企业管理信息化是企业信息化建设中比重最大、难度最大、应用最为广泛的一个领域,涉及企业管理的各项业务及各个层面。企业管理的信息化建设就是在规范管理基础工作、优化业务流程的基础上,通过信息集成应用系统有效地采集、加工、组织、整合信息资源,提高管理效率,实时动态地提供管理信息和决策信息。企业供应链管理的信息化使企业的生产和管理活动发生了前伸和后延。企业从原材料、零部件的采购、运输、存储、加工制造、销售,直到最终送到并服务于客户,形成了一条由上游的供应商、中间的生产者和第三方服务商、下游的销售客户组成的链式结构,而企业的生产活动、管理流程受到这条供应链的制约和影响。
当前,中国及大多数国家的工业发展都面临着极大的困境和挑战,包括:产能严重过剩、个性化产品稀缺、产品越来越复杂、生产资料未能得到有效配置、大型设备市场日渐饱和等,亟待寻求工业回归、工业转型升级的战略方案。“互联网+”极具活力的思维及创新的商业模式,为处于困境、亟待转型升级的制造业提供了一种新的转型方向,
通过改革生产方式和商业模式以及提高生产技术,实现客户个性化定制产品的小批量、大规模生产,解决工业产品大规模产能严重过剩与无法满足客户对产品的个性化需求的问题,以满足对客户尊重与肯定及自我实现的需求。
尝试通过网络化协同制造解决核心技术薄弱、高端产品制造能力较低的问题,即借助互联网或工业云平台,发展企业间协同研发、众包设计、供应链协同等新模式,以有效降低资源获取成本,大幅延伸资源利用范围,打破封闭疆界,加速从“单打独斗”向产业协同转变,促进产业整体竞争力提升。
尝试通过创新创业、制造业分享型经济改善产能过剩而资源未得到有效配置及自主创新能力不强的问题。
以核心产品为轴心,通过收集、分析产品的客户使用数据及周边环境数据,为用户提供延伸服务,扩展产品价值空间,拓展新市场,实现以产品为核心的经营模式向“制造+服务”的模式转变。
大数据的价值通过数据的收集、预处理、分析、可视化和访问等活动来实现。在IT价值链维度上,大数据价值通过为大数据应用提供存放大数据的网络、基础设施、平台、应用工具及其他服务来实现,从而提高运营效率和支撑业务创新。大数据技术支撑的企业架构,参考TOGAF划分方法,可分成业务架构、信息系统架构成及IT技术架构3个层次,如图4所示。
业务架构定义了业务战略、管理、组织和关键业务流程,是企业全面的信息化战略和信息系统架构的基础,是数据、应用、技术架构的决定因素。业务架构是把企业的业务战略转化为日常运作的渠道,业务战略决定业务架构。业务架构将高层次的业务战略和目标转换成可操作的业务模型。业务架构是对企业关键业务战略及对业务功能和流程的表达,通常是在业务模型的基础上实施的业务设计,从不同的视角阐述业务模块及其之间的关系,即业务的主要流程。业务架构是对业务的主要流程和共享流程的适当划分,对业务元素生命周期的阐述和分析。通过战略规划工业大数据业务和构建企业架构,从而获得工业大数据的价值。为充分发挥工业大数据价值,避免形成“信息孤岛”,需要构建统一的信息系统架构,以实现各应用系统及数据的用户访问和互操作。基于工业大数据业务战略的信息系统架构是一个体系结构,它反映制造企业的信息系统的各个组成部分之间的关系以及信息系统与相关业务、信息系统与相关技术之间的关系。信息系统架构包括应用架构和数据架构。其中,应用架构描述了支持企业运作所需应用系统的蓝图,包含应用层次、功能、实现方式和建设标准等,它主要研究应用系统间的交互关系、应用与核心业务的对应关系,是企业总体框架研究的重点,可以说是业务架构和技术架构之间的桥梁。工业大数据应用架构既包含对应于工业大数据架构中的企业纵向层各层次的应用系统,也包含基于大数据技术的应用系统。而数据架构则是对复杂组织体的主要数据类型及来源、逻辑数据资产、物理数据资产以及数据管理资源的结构及交互的描述。随着工业4.0浪潮的兴起,物联网、云计算、大数据、人工智能、增强现实/虚拟现实等信息技术不断向工业领域融合渗透,为工业大数据应用的实施奠定了坚实的技术基础。其中,物联网技术使得无处不在的末端设备和设施,可以通过射频识别、红外感应器、全球定位系统等信息传感设备,按约定的协议与互联网相连接,进行信息交换和通信,使物品及其状态可见,从而实现智能化识别、定位、追踪、监控和管理;云计算技术提供了一种可通过网络实现按需可动态伸缩的廉价计算服务;大数据技术及AI技术则使得在可接受的时间内从海量数据中分析、挖掘出潜在价值以及实现趋势预测、群体智慧模式等成为可能;通过AR/VR技术则可实现对工厂环境、工业设备等的模拟及增强体验。制造业企业每天甚至每时每刻都在产生大量的数据,种类繁多,覆盖了工业产品的全生命周期,包括设计数据、生产数据、价值链数据以及相关的外部数据。这些数据或来自传感器,或来自智能设备的数据采集与监视控制系统,或来自企业的设计模型、信息系统。
实现工业大数据应用需要进行数据采集及预处理、存储、分析挖掘、针对特定业务进行应用及最后展示结果,相应地,工业大数据信息技术架构也分为6层:数据层、数据采集层、存储层、计算层、应用层及展示层。若企业独自建设每一层,建设门槛会比较高。国内外已研发、建设完成一系列与工业云服务及(工业)大数据处理相关的开源技术组件,人工智能技术也进一步取得了长足的发展,为工业领域的智能化转型提供了可选方案,也降低了工业大数据应用的建设实施门槛。企业若非必要,无需自行实现技术架构的每一个组件,可根据需要选择使用相应的开源组件搭建工业大数据应用,还可根据需要选用不同类型、不同级别的工业云服务,在此基础上实施工业大数据应用,以便更专注于企业擅长的业务领域及技术领域。