一文看懂人工智能的六个关键概念和实施AI项目的七个注意事项 / 开普饭

人工智能并不能解决所有问题，但如果应用得当，它可以在短时间内产生很大的变化。

您或许已经听说过机器学习和人工智能（AI）的前景。这两个技术概念，已经引起了全世界的关注。自动驾驶汽车、人形机器人、设备预测维护——这些应用不仅仅限于消费者领域，工业界也开始疯狂了。看看最近主要工业出版物的诸多头条新闻就知道了。这种趋势仍将继续，实际上，未来它可能无处不在。因此，您不妨了解一下。

AI的兴起

传统上，分析是统计学家的专长。在工业领域普及计算机之前，分析师使用铅笔和纸完成分析工作。而现在的分析，是描述数据科学的总称。

例如，沿着一条简单的线找到一个点，通常属于标准数据分析的范畴。该线被认为是“回归”。沿着线找到点是“回归分析”。执行简单的回归分析司空见惯。

机器学习可以看作是AI 的子集，尽管这两个术语通常可以互换使用。机器学习是AI的统计方面，其中还包括认知计算和建模。每个类别的边界可能是模糊的。

表征AI的另一种方法，是使用真实世界数据得出结论的计算机代码。如果以此方式建立系统，则可以根据这些结论自动做出决策。然后，可以将更多信息输入系统并做出更多的决策。对AI 的描述，反映了当今流行文化的对AI 的理解，它反映了人类的思想方式。我们接受信息，得出结论并做出决定。

人类思想常常可以用“如果，那么”的形式来表达，当然也可以用其它形式表示。与此类似，我们也可以用用其中一种算法来实例化AI。根据功能对算法进行分组很有用。我们来了解一下机器学习算法的主要类别。

聚类分析

一些算法将事物进行“分组”。例如，假设正在生产零部件。质保部门或在线测量系统将把两个测量功能与零件关联：宽度和高度。将这些数据用于生成图表。可以使用颜色来明确分类方案。如果您使用的是Excel 向导，则可以自己生成图形，在新零件通过时将其绘制到图表上（见图1）。

图1

可以使用颜色对零件进行分类，但是如果相关参数太多而无法使用传统的可视化技术显示，该怎么办？本文图片来源：inductiveAutomation

随着将更多信息添加到架构中，集群功能变得更强大。假设添加了有关次品的信息。结果显示，蓝色组代表的次品占比将近80％，而绿色组则占大约20％。

但是为什么要停在那里？假设我们也开始收集长度信息。想象一下在三个维度上绘制图表。先进的绘图程序可以做到这一点，因此可以继续手动输入和分组信息。当分组得到改善后，蓝色组显示的次品占比达到85％。

此时，如果使用机器学习算法完成聚类，它将执行分类，但是只能自动执行可以手动完成的操作。那为什么机器学习是更好的选择？

更多维度

这个时候，如果需要增加另一个维度怎么办？也许电导率是有意义的参数，或者是湿度读数，或者是阳极氧化电流。但是3D 图只能具有三个维度。另一方面，使用机器学习算法意味着可以绘制四个、五个、六个甚至一百个维度的图形。

聚类算法根据每个零件的属性绘制图形，将彼此接近的零件识别为一组。一旦完成此操作，就更容易看到哪些属性或属性的组合最有可能产生次品。

这意味着可以根据其它属性自动对分组进行进一步细化，并且可能对蓝色组进行充分细化，以预测95％或99％的次品。对于最有可能需要返工的产品，洞察力得到了显著改善。可能的选择是在采取不必要的步骤之前，将其从生产环节中撤出，从而可以节省时间和成本。

决策树

决策树是另一种在概念上具有重大意义的简单技术。在数据挖掘中决策树训练是一个常用的方法。目标是创建一个模型来预测样本的目标值。在日常生活中，我们经常会建立决策树，以回答诸如以下问题：交通状况如何？天气如何？我今天应该给妈妈打电话吗（请参见图2）？构建一个算法是一项简单任务。首先，确定描述过程的数据以及有关结果的信息。结果生成的算法，将构建一棵映射预测结果的树。它会通过多种可能性（也许是数千甚至更多种），来构想出尽可能准确的树。

图2

决策树从简单元素开始，但可以用来预测高度复杂过程的结果。

模型与训练

其它重要的分析概念，还包括建模和训练。当将过程数据输入到机器学习算法中时，就会进行训练，从而生成模型，进而识别出好的和坏的过程示例。

想象一下，有人坐下来用笔写出一个决策树。然后他们写了一个又一个决策树。之后，就可以确定最佳决策树，然后放弃其它决策树。最终的决策树就是模型。对于聚类算法，该模型将仅被称为“聚类模型”或“模型”。

换句话说，使用最佳决策树可以利用一组数据基于处理流程来获得预测。回到前面的示例，第一个语句可能是“如果宽度小于23.5，那么xxx”，第二个语句可能是，“如果高度大于43.3，那么xxx。”机器学习算法创建问题，以获得它所能得到的最佳答案。

决策树在预测性维护应用中具有很大的实用性。如前所述，回归分析可能很简单。但当涉及到机器学习算法时，它可能会很复杂。

回归分析

同样，回归分析的基础可以通过在一条线上找到一个点来说明。要画一条线，首先要确定画一条什么类型的线。它是曲线吗？是直线吗？它有很多曲线吗？如果将其绘制在x-y 二维平面中，这很容易做到。当将机器学习应用于复杂数据和更多维度时，它会大放异彩。手工绘制100 个维度，永远是不切实际的，但是一种算法可以轻松地解决这一问题，并且可以轻松找到最佳拟合回归（如果存在的话）。

回归分析在过程调整和生产预测中非常有用。并非所有数据都适合进行回归分析（例如，聚类数据），但是对于那些某个因素会影响其它因素的项目可能非常有用。

深度学习

也许您听说过深度学习和神经网络，那您真的了解它们是什么吗？深度学习是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。神经网络是包含数千或数百万个节点的模型，这些节点是计算机代码的小块，每个块都可以接受输入并产生输出。所谓神经网络是因为它们旨在模拟神经元在大脑中的工作方式。就像我们大脑中的神经元一样，节点之间的某些连接相对较强，其它可能相对较弱。

图3

可以将神经网络设计为大致类似于大脑的工作方式。

对于神经网络，算法不只是配置节点。它们自我构建，从而可以建立具有数百万个节点的模型来处理数据。

当神经网络“消化”数据时，它会变形和变化，直到在预测结果或提供分类方面达到设定目标为止。经过训练，它可以做几乎所有事情。可能需要获取最近的传感器读数并经计算获得问题出现的可能性。或者，它可以评估一组1 和0，以确定是否描绘了一只猫。所有这些数百万个节点，都以某种方式“理解”了图像。对每个节点只是简单的数学运算，但节点的排列和权重都可以以某种形式用于获得结论。

这就是为什么很少能有人真正理解它们的原因。要求数据科学家解释神经网络，他们可能能够解释数学问题。如果请同一位数据科学家解释如何在这些字节中识别“怪兽”，他可能会用“魔法”来解释。

神经网络如此令人印象深刻，它们在工业领域也提出了难题。如果算法告诉您要做某事，您会做吗？如果是决策树、回归分析或聚类模型分配建议，则可以跟踪获得结论的方式。但是，神经网络可能不会让你了解获得系统的“原因”。它只是给出一个可以相信与否的答案。如果这些决定可能会导致停机或生产瓶颈，则可能会遭到质疑，为什么要使用算命先生的魔法水晶球来制定决策。

未来就在这里

世界正在变化，人工智能和机器学习技术将不断发展，并且在更多行业得到应用。人工智能技术已经证明了其价值，采用的企业看到了已经获得的领先优势。人工智能并不能解决所有问题，但如果应用得当，它可以在短时间内产生很大的变化。所以放开手脚，大胆的去建立模型吧，你会在过程中找到答案的。

实施AI项目的7个注意事项

如果你正在学习或计划实施机器学习或人工智能项目，有一些事要优先考虑。

识别问题

首先选择要改进的过程、区域或技术。在机器学习或AI 似乎可以提供帮助的地方，找到最需要解决的问题和目标。

收集数据

数据越多越好。成千上万的数据点，尽可能多的帮助训练模型。确保使用高质量的数据。不良数据很容易引发算法失败。数据预处理和数据清理，是影响成功的关键因素。

整理统计数据

了解采样技术以及因果关系和相关性。了解结果的质量，有助于避免发生错误。

具有专业知识

了解过程或技术对于了解结果是否合理至关重要。数据科学家很棒，但是仅仅关注某些数据，不会取得好的结果。

创建模型

这可以与现有的任何机器学习软件一起使用。现代的监控和数据采集（SCADA）系统，内置了一些流行的机器学习算法。许多云产品和平台都将这种类型的算法作为选项。

部署模型

通常，可以在机器旁边或内部运行模型，甚至构建在云上或利用其它工具。寻找运行模型的最佳方法。如果是关键过程的一部分，则在本地运行是理想选择。

监控是否成功

如果无法衡量成功，就没有人会知道它的存在。可以将先前的过程数据与最新数据进行比较。如果模型需要改进，请返回到第5 步。请记住，有时尝试几种模型或将几种模型组合会产生更好的结果。

一文看懂人工智能的六个关键概念和实施AI项目的七个注意事项

相关推荐