首页>软件资讯>行业资讯

行业资讯

Minitab 通过机器学习和 R 集成减少过程缺陷的 4 个步骤

发布时间:2023-03-20 13:24:53人气:442

如果您不是程序员,尝试使用预测分析来确定导致流程失败的原因似乎令人望而生畏。


我们即将向您展示这并不需要如此!本篇文章内容是在 Minitab 与 R 和 Python 的集成的帮助下,更轻松地使用编程语言,我们将探索如何使用 R 在 Minitab 中构建神经网络,以补充和比较我们自己的预测分析模块的结果。


Q什么是R?


A


R 是一种开源编程语言,可用于执行许多与数据相关的任务,例如数据转换、建模和可视化。R 有一个用于数据和统计分析的库目录,以及机器学习算法,尽管它取决于用户理解语法的能力。


Q为什么将 R 与 MINITAB 集成?


A


Minitab 统计软件是专业人士减少缺陷的首选工具。它在易于使用的界面中提供统计和预测分析。


通过 Minitab 集成,您可以使用极其强大的 R 脚本。这简化了非 R 程序员通常难以部署的过程。我们的集成允许更广泛的人访问 R 脚本,从而成倍增加他们可以产生的好处。


Minitab 的桌面应用程序为 R 集成提供了一个定制包,称为mtbr。


Q如何使用 R 编程语言


在 Minitab 中构建神经网络?


场景


Susan 是一家零件制造公司的质量工程师。最近,他们的一款产品出现了质量问题——许多批次不合格导致成本增加和订单积压。


挑战


苏珊的任务是找到降低流程缺陷率的方法。幸运的是,她有关于生产参数以及每批次是否合格的数据。Susan 的想法是使用预测分析来尝试和理解:


1. 哪些生产参数会影响缺陷批次的几率?


2. 他们需要将这些参数维持在什么水平才能最大限度地减少批次失败的可能性?


她想尝试各种预测分析模型,以找到最适合她的数据的模型。


幸运的是,Susan 可以在她的 Minitab 中选择回归模型和CART®,以及预测分析插件中提供的Random Forests®和TreeNet®模型。


曲线球


她的老板听说过神经网络并想尝试使用它们,但这不是 Minitab 的一部分——幸运的是,R 能够构建神经网络。


由于 Susan 不是经验丰富的 R 用户,幸运的是她可以在 Minitab 的 R 集成中运行 R 脚本。这将提供几个优点。


通过将所有数据和输出保存在 Minitab 中,Minitab 的 R 集成将使整个过程对她来说更加轻松。


Susan 无需在两个不同的程序上分别运行她的分析,而是可以在 Minitab 中运行所有内容并轻松比较不同模型的性能和结果。


从那里,苏珊可以通过将所有 Minitab 输出(表格、图形等)导出到 PPT,轻松地为她的经理制作PPT。


执行分析


那么 Susan 如何使用 Minitab 的预测分析 和 R 集成进行她的分析呢?


首先,她将数据加载到 Minitab 中。她的公司使用Minitab Connect自动从各种数据源收集生产数据,因此她可以轻松地将这些数据加载到 Minitab 中。


1.png

将数据加载到 Minitab 后,她就可以开始了!首先,让我们来看看数据。

2.png

这个想法是使用列 C1 到 C8 中的数据来了解批次是否会失败(缺陷列等于 1)。她将使用 Minitab 中可用的模型。


为此,她选择了Minitab® 的自动机器学习。这将在数据集上使用所有 Minitab 模型,然后选择性能最佳的模型,从而节省大量时间。


3.png

Minitab 中可用的最佳模型是随机森林和 TreeNet 模型。TreeNet 模型的误分类率最高,为 0.8% (0.008)——这意味着它对批次是通过还是失败的预测只有 0.8% 是错误的。Susan 选择 TreeNet 模型是因为它提供比随机森林更有用和信息量更大的输出。


接下来,是时候使用 Minitab 的 R 集成在 R 中拟合神经网络了。这是脚本示例。

4.png

作为输出的一部分,我们可以可视化神经网络。


5.png

左侧的输入层(第一行节点)从八个输入变量中的每一个接收信息。每条线上方是突触权重,它们影响网络的下一层。有一个由两个神经元组成的隐藏层,蓝色圆圈代表偏差,对应于标准回归模型中的截距,这是魔术发生的隐藏层!右侧的输出神经元表示缺陷变量。


该脚本保存为 R 脚本 (.R),要在 Minitab 中执行它,我们使用命令 RSCRIPT,后跟用引号引起来的脚本名称。


该模型的误分类误差为 7%,不如 TreeNet 模型准确——因此 Susan 决定使用 TreeNet 模型。


接下来,她使用 TreeNet 输出来了解哪些参数对导致有缺陷的批次影响最大。Minitab 模型的好处之一是它们提供了大量补充信息(如下图)作为标准,使您更容易理解模型对您的意义。

6.png

O2、生产率、苛性碱和 MgSO4 似乎都对缺陷率有很大影响。为了让事情变得更好,Susan 必须了解这些参数产生影响的方式。TreeNet 输出可以帮助解决这个问题。

7.png

那么,他们需要在什么水平上控制这些参数才能最大程度地减少批次失败的可能性?


当我们在图表上看到较高的值时,出现次品批次的可能性较低。基于这些图,它表明:


· O2 应保持在 20.5 至 22% 之间


· 较低的生产率产生较低的缺陷率


· 苛性碱应保持在 60% 到 70% 之间


· MgSO4值高于6%可降低批次失败的可能性


在此基础上,Susan 为每个有影响的参数实施了控制计划,将它们控制在一个范围内,从而将次品批次的可能性保持在较低水平。

次品率降低了


上一条:监测频率提升30倍? AVEVA助力全球大型FPSO船舶供应商实现效率跃迁

下一条:全生命周期管理,桌面云5.5.6新版本应用管理能力再升级