Machine learning and deep learning based predictive quality in manufacturing: a systematic review
TL;DR 精炼摘要
本文系统综述了2012-2021年间制造业中基于机器学习与深度学习的预测质量研究,分类分析了相关制造过程、数据类型及模型方法,揭示现有方法的应用范围和不足,指出了领域面临的挑战并提出未来研究方向,促进质量保证的数据驱动智能化发展。
摘要
Journal of Intelligent Manufacturing (2022) 33:1879–1905 https://doi.org/10.1007/s10845-022-01963-8 Machine learning and deep learning based predictive quality in manufacturing: a systematic review Hasan Tercan 1 · Tobias Meisen 1 Received: 22 December 2021 / Accepted: 5 May 2022 / Published online: 28 May 2022 © The Author(s) 2022 Abstract With the ongoing digitization of the manufacturing industry and the ability to bring together data from manufacturing processes and quality measurements, there is enormous potential to use machine learning and deep learning techniques for quality assurance. In this context, predictive quality enables manufacturing companies to make data-driven estimations about the product quality based on process data. In the current state of research, numerous approaches to predictive quality exist in a wide variety of use cases and domains. Their applications range from quality predictions during production using sensor data to automated quality inspection in the field based on measurement data. However, there is currently a lack of an overall view of where predictive quality research stands as a whole, what approaches are currently being investi
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
基于机器学习和深度学习的制造业预测质量:一项系统综述 (Machine learning and deep learning based predictive quality in manufacturing: a systematic review)
1.2. 作者
Hasan Tercan, Tobias Meisen
1.3. 发表期刊/会议
该论文于2021年12月22日收到,2022年5月5日被接受,并于2022年5月28日在线发表。根据其严谨的审稿流程和详细的发表日期,以及版权声明,推测其已发表在某一学术期刊上,但具体期刊名称在提供的文本片段中未明确给出。
1.4. 发表年份
2022年
1.5. 摘要
随着制造业持续数字化以及制造过程和质量测量数据整合能力的提升,利用机器学习 (Machine Learning, ML) 和深度学习 (Deep Learning, DL) 技术进行质量保证 (Quality Assurance) 具有巨大潜力。在此背景下,预测质量 (Predictive Quality) 使制造企业能够基于过程数据对产品质量进行数据驱动的估计。当前研究现状中,预测质量方法在各种用例和领域中大量存在,其应用范围从利用传感器数据进行生产过程中的质量预测,到基于测量数据在现场进行自动化质量检测。然而,目前缺乏对预测质量研究整体现状、当前正在研究的方法以及现有挑战的全面概述。本文通过对2012年至2021年间涉及制造业预测质量的科学出版物进行全面系统的综述,解决了这些问题。论文根据所涉及的制造过程、使用的数据基础和机器学习模型对出版物进行分类。在此过程中,收集了该领域范围的关键见解以及解决方案方法的差距和相似之处。最后,从研究结果中推导出了预测质量面临的开放挑战,并展望了未来解决这些挑战的研究方向。
1.6. 原文链接
/files/papers/6903060f59708f78ec6faed6/paper.pdf (此为本地文件路径,表明该论文PDF内容已提供)
2. 整体概括
2.1. 研究背景与动机
当前制造业正处于工业4.0 (Industry 4.0) 和数字化 (Digitization) 的浪潮中,这带来了前所未有的技术机遇,特别是机器学习 (ML) 和深度学习 (DL) 与新通信技术的结合,为数据驱动的智能制造 (Smarter Manufacturing) 提供了广阔前景。质量保证 (Quality Assurance) 是其中一个能够显著受益的领域。传统的质量保证方法往往是反应性的或基于抽样的,而数据驱动的自动化质量分析,即预测质量 (Predictive Quality, PQ),则能通过对产品质量进行数据驱动的估计,从而实现预防性的质量改进。
然而,尽管预测质量的研究和应用案例众多,涵盖了从生产过程中的故障预测到自动化质量检测等广泛场景,但这些研究往往是孤立进行的,缺乏一个全面的视角来理解:
-
预测质量研究的整体现状如何?
-
当前正在探索哪些具体方法?
-
存在哪些局限性和挑战?
-
未来研究应朝哪个方向发展?
这些知识空白使得该领域难以进行有效比较,也阻碍了对其整体发展趋势和未来方向的把握。因此,本文旨在通过系统综述来填补这一空白。
2.2. 核心贡献/主要发现
本文通过对2012年至2021年间发表的81篇科学论文进行系统综述,提供了对制造业预测质量领域的全面概述。其主要贡献和发现包括:
- 全面概述与分类: 首次对制造业中基于机器学习和深度学习的预测质量研究进行了全面的系统综述,涵盖了2012-2021年间的文献,并根据制造过程类型、数据基础和机器学习模型进行了详细分类。
- 确定研究范围和应用场景: 揭示了预测质量在不同制造过程(如切削、连接、增材制造等)中的应用范围,识别了主要的质量标准和缺陷类型。发现切削和连接是研究热点,而某些领域(如材料性能改变)研究较少。
- 分析数据基础和特征: 总结了用于模型训练的数据来源(仿真数据、基准数据、真实生产数据、实验数据)、数据量、输入变量类型(过程参数、传感器数据、产品测量)和数据模态(时间序列、图像、数值等),发现实验数据量通常较小,且多模态数据整合研究不足。
- 识别主流机器学习模型: 分析了预测质量任务中常用的机器学习和深度学习模型,发现多层感知器 (MLP) 和卷积神经网络 (CNN) 是当前最受欢迎的模型,尤其是在最新的研究中。同时,也指出了其他高级深度学习模型(如Transformer网络)应用不足的现状。
- 揭示关键挑战与未来方向: 从综述结果中凝练出当前预测质量研究面临的开放挑战,例如数据稀疏性 (Data Sparsity)、缺乏基准数据集 (Benchmark Datasets)、模型在真实生产环境中的集成与部署 (Integration and Deployment) 困难等,并提出了未来研究的七个具体方向,包括合成数据生成 (Synthetic Data Generation)、新型深度学习方法、迁移学习 (Transfer Learning) 和持续学习 (Continual Learning) 等。
3. 预备知识与相关工作
本章旨在为读者铺垫理解本文综述内容所需的基础概念和背景知识。
3.1. 基础概念
3.1.1. 工业4.0 (Industry 4.0)
工业4.0 指的是第四次工业革命,其核心特征是智能制造 (Smart Manufacturing)。它融合了信息物理系统 (Cyber-Physical Systems, CPS)、物联网 (Internet of Things, IoT) 和云计算 (Cloud Computing) 等技术,旨在实现生产过程的高度自动化、智能化、互联化和柔性化。在工业4.0背景下,数据被视为重要的生产要素,为数据驱动的决策和优化提供了基础。
3.1.2. 预测质量 (Predictive Quality, PQ)
预测质量 是指在生产过程中,利用数据驱动的方法,基于过程数据或产品数据来估计或预测产品相关的质量。其核心目标是能够预见未来的质量状况,从而在缺陷发生或质量偏差扩大之前采取预防性措施,以避免报废、降低成本、提高产品质量和生产效率。本文进一步将 预测质量 定义为:在生产中利用机器学习 (ML) 和深度学习 (DL) 方法,基于过程和产品数据估计产品相关质量,以获取质量增强洞察力。
- 估计 (Estimation):包括对质量的预测 (Prediction) 和分类 (Classification)。
- 产品相关质量 (Product-related Quality):可以是固定的质量参数,也可以是已知的产品缺陷。
- 过程和产品数据 (Process and Product Data):包括产品特性、过程参数、过程状态和计划信息。
3.1.3. 机器学习 (Machine Learning, ML)
机器学习 是人工智能的一个分支,它使计算机系统能够从数据中学习,而无需进行明确的编程。它通过识别数据中的模式和规律,构建模型,然后利用这些模型对新数据进行预测或决策。在预测质量中,机器学习 模型被训练来从制造过程中收集的数据中识别出与产品质量相关的模式。
3.1.4. 深度学习 (Deep Learning, DL)
深度学习 是 机器学习 的一个子领域,它使用具有多层结构的神经网络(即深度神经网络)来从数据中学习复杂的表示。相比传统的 机器学习 方法,深度学习 模型通常在处理大规模、高维度数据(如图像、时间序列数据)时表现出更强的特征学习能力和模式识别能力。
3.1.5. 监督学习 (Supervised Learning)
监督学习 是 机器学习 中最常见的一种范式。它通过从带有标签(或称“真值”)的数据集中学习来构建模型。每个训练样本都包含输入特征和对应的期望输出。模型的目标是学习输入特征与输出标签之间的映射关系,以便对未见过的新数据进行准确的预测。预测质量 主要采用 监督学习 方法,因为其目标是根据过程数据预测已知的产品质量参数或缺陷类型。
监督学习的两种主要任务:
- 回归 (Regression):目标是预测一个连续的数值型输出变量。例如,预测产品的表面粗糙度、尺寸偏差或拉伸强度。
- 分类 (Classification):目标是预测一个离散的类别型输出变量。例如,将产品分类为“合格/不合格 (OK/NOK)”、不同类型的缺陷(如裂纹、气孔)或不同的质量等级。
3.1.6. 预测质量的机器学习任务
根据本文的分类,预测质量中 机器学习 和 深度学习 的主要任务包括:
- 质量描述 (Quality Description):识别、评估和解释过程变量与产品质量之间的关系。主要目标是获取对过程内在联系的洞察。
- 质量预测 (Quality Prediction):基于过程变量,对数值型质量变量进行模型驱动的估计。目标是预测产品质量,用于决策支持或自动化。
- 质量分类 (Quality Classification):与
质量预测类似,但涉及对分类(二元或标称)质量变量的模型驱动估计。例如,预测特定产品缺陷类型。
3.2. 前人工作
本文在引言和相关综述论文 (Related Survey Paper) 部分提及了多项相关的前人工作,并强调了本文与它们的区别:
-
早期数据挖掘在质量改进中的应用综述:
- Köksal et al. (2011):对制造业中数据挖掘在质量改进任务中的应用进行了广泛的文献综述,并根据预测质量任务进行了分类。
- Rostami et al. (2015):提出了类似的方法,但侧重于支持向量机 (Support Vector Machine, SVM) 的应用。
- 本文的差异: 这两项研究时间较早,未能涵盖近年来
机器学习和深度学习领域的最新进展。
-
关注过程优化的
机器学习应用综述:- Weichert et al. (2019):综述了
机器学习在生产过程优化中与产品或过程特定指标相关的应用。该研究表明优化方法主要基于生产工厂中的根本原因分析和故障诊断,或机器学习方法与优化方法的结合。 - 本文的差异: 尽管该研究与本文有重叠,但其主要关注
过程优化方法。本文则侧重于质量估计方法,并根据所用的数据和方法对其进行评估。
- Weichert et al. (2019):综述了
-
其他
机器学习应用但范围不同的综述:- 生产和制造环境中的
AI和ML技术: 例如 Shang and You (2019)、Fahle et al. (2020)、Mayr et al. (2019)、Sharp et al. (2018) 等研究。它们涵盖了更广泛的生产背景下的机器学习应用,如过程监控、过程规划、控制等。 - 相关研究领域: 如
ML驱动的预测性维护 (Predictive Maintenance) (Dalzochio et al., 2020; Zonta et al., 2020)、状态监测 (Condition Monitoring) (Serin et al., 2020b) 和机器故障诊断 (Machine Fault Diagnosis) (Ademujimi et al., 2017)。 - 本文的差异: 本文明确区别于上述研究,因为它主要关注的是对所生产产品质量的评估和预测,而不是设备的维护、过程的优化或更广义的生产上下文。
- 生产和制造环境中的
3.3. 技术演进
在 工业4.0 的推动下,制造业的数字化进程加速,使得大量过程数据和质量数据得以汇集。这为 机器学习 和 深度学习 在 质量保证 领域的应用提供了肥沃的土壤。从早期的 数据挖掘 和传统 机器学习 方法(如 SVM、决策树)开始,技术演进逐步转向更复杂的模型,尤其是 深度学习 模型,如 卷积神经网络 (CNN) 在图像识别中的突破,以及 循环神经网络 (RNN) 在时间序列数据处理中的优势,使得对更复杂、高维度数据的质量预测成为可能。本文的工作正是在这种技术演进的背景下,对当前 预测质量 领域内 ML/DL 应用现状进行的一次总结性梳理。
3.4. 差异化分析
本文的核心创新和区别在于其专注性和时效性。
- 专注性: 与许多涵盖更广泛
ML在制造业应用的综述不同,本文将焦点严格限定在预测质量,即使用ML/DL方法对“产品相关质量”进行“数据驱动的估计”这一特定问题上。这使得其分析更加深入和聚焦。 - 时效性: 论文关注2012年至2021年的出版物,涵盖了
深度学习兴起和迅速发展的重要十年。这使其能够提供对预测质量领域ML/DL最新进展的洞察,弥补了早期综述的时效性不足。 - 系统化分类: 本文提出了一套系统的分类框架,从制造工艺、数据基础和
ML模型三个维度对文献进行分类,这有助于识别领域内的相似性、差距和未被充分探索的领域。
4. 方法论
本研究采用系统综述 (Systematic Review) 的方法,旨在全面回顾2012年至2021年间制造业中基于 机器学习 和 深度学习 的 预测质量 相关科学出版物。研究方法遵循明确的步骤,包括定义研究问题、文献检索、筛选和分类。
4.1. 方法原理
本综述基于引言 (Introduction) 部分提出的三个主要研究问题(Q1、Q2、Q3)。这些问题被转化为具体的分类标准 (Categories),用于对所选出版物进行结构化分析和总结。
- Q1: 涉及哪些制造过程和质量标准? 旨在发现该领域的范围、应用场景,以及领域内的相似性和差距。
- Q2: 用于模型训练的数据特征是什么? 旨在找出出版物中常用的数据源、用于
ML模型训练的变量以及数据的模态。 - Q3: 通常训练哪些监督学习的
机器学习模型? 旨在发现涉及的监督学习问题、用于质量估计的ML和DL模型,以及它们之间是否进行了比较。
4.2. 核心方法详解
4.2.1. 分类标准
为了回答上述研究问题,论文首先定义了一套分类标准,如 Table 1 所示。
以下是原文 Table 1 的结果:
| Question | Category | Description |
|---|---|---|
| Q1 | Use case | Main use case of paper and purpose of predictive quality |
| Process | Addressed manufacturing process (e.g. laser welding, deep drawing) | |
| Category | Category of process according to DIN 8580 (e.g. cutting, forming) | |
| Criterion | Estimated quality criterion (e.g. product dimensions, OK/NOK quality) | |
| Q2 | Data source | Main source of process data (e.g. running production, simulation) |
| Input variables | Data parameters used for the model training (e.g. sensor data) | |
| Data modality | Data types of gathered data (e.g. time series, categorical data) | |
| Data amount | Number of observations used for model training | |
| Q3 | Learning task | Formulated learning task (e.g. classification, regression) |
| Prime model | Primarily used (or best performing) ML/DL model (e.g. SVM, CNN) | |
| Baselines | ML/DL-models used for comparison to prime model (e.g. SVM, CNN) |
符号解释:
Question:对应于引言中提出的三个主要研究问题(Q1, Q2, Q3)。Category:为回答相应研究问题而定义的具体分类维度。Description:对每个分类维度的详细说明和示例。Use case (用例):论文的主要用例和预测质量的目的。Process (工艺):涉及的制造过程(例如,激光焊接、深冲)。Category (类别):根据 DIN 8580 标准的工艺类别(例如,切削、成形)。Criterion (标准):估计的质量标准(例如,产品尺寸、合格/不合格 OK/NOK 质量)。Data source (数据源):过程数据的主要来源(例如,正在运行的生产、仿真)。Input variables (输入变量):用于模型训练的数据参数(例如,传感器数据)。Data modality (数据模态):收集到的数据类型(例如,时间序列、分类数据)。Data amount (数据量):用于模型训练的观测数量。Learning task (学习任务):制定的学习任务(例如,分类、回归)。Prime model (主要模型):主要使用(或表现最佳的)ML/DL模型(例如,SVM、CNN)。Baselines (基线模型):用于与主要模型进行比较的ML/DL模型(例如,SVM、CNN)。
4.2.2. 文献检索策略
研究团队在 Web of Science 和 ScienceDirect 数据库中执行了文献检索。考虑到 预测质量 和 制造业 领域的术语多样性,检索使用了三类不同的搜索词:
-
预测质量术语 (Predictive Quality terminology)
-
机器学习领域术语 (Machine Learning field)
-
制造业领域术语 (Manufacturing domain)
Table 2列出了所有定义的搜索词。
以下是原文 Table 2 的结果:
| Category | Search terms |
|---|---|
| Predictive Quality | Predictive quality, predictive analytics, fault prediction, fault classification, defect prediction, quality prediction, smart manufacturing |
| Learning | Deep learning, neural network, machine learning |
| Domain | Manufacturing, production, industrial, engineering, automation, assembly |
符号解释:
Category:搜索词所属的类别。Search terms:该类别下的具体搜索关键词。-
Predictive Quality (预测质量):包括Predictive quality (预测质量)、predictive analytics (预测分析)、fault prediction (故障预测)、fault classification (故障分类)、defect prediction (缺陷预测)、quality prediction (质量预测)、smart manufacturing (智能制造)。 -
Learning (学习):包括Deep learning (深度学习)、neural network (神经网络)、machine learning (机器学习)。 -
Domain (领域):包括Manufacturing (制造)、production (生产)、industrial (工业)、engineering (工程)、automation (自动化)、assembly (装配)。搜索查询的构建方式是:查找包含每类至少一个词的出版物。此外,结果筛选限定在2012年至2021年间的出版物(检索于2021年6月29日进行)。初步检索共获得了1261篇潜在相关出版物。
-
4.2.3. 文献筛选和排除
为了确保最终选定的出版物符合研究范围,研究团队进行了两阶段筛选:
-
初筛 (Pre-selection):
- 基于标题和摘要进行筛选。
- 在此阶段,排除了大量属于预测性维护 (Predictive Maintenance)、故障诊断 (Fault Diagnosis)、剩余使用寿命预测 (Remaining Useful Lifetime Prediction)、软件缺陷预测 (Software Defect Prediction)、水质预测 (Water Quality Prediction)、过程工程 (Process Engineering) 或土木工程 (Civil Engineering) 领域的出版物。
- 初筛后,剩余144篇出版物。
-
详细阅读和排除 (Detailed Reading and Exclusion):
-
对剩余的144篇出版物进行详细阅读,并根据预定义的分类标准进行归类。
-
在此过程中,进一步排除了符合以下排除标准的出版物:
- 不包含所涉及制造过程或数据基础信息的出版物。
- 综述性论文和文献研究(即非原创研究)。
- 未进行任何方法开发、实现或评估的出版物。
- 无法获取的出版物。
-
经过所有筛选步骤,最终有81篇出版物被选中并用于本研究。
Figure 2示意性地展示了整个文献检索方法。
Figure 2. 文献检索方法论示意图符号解释:
-
Web of Science,ScienceDirect:进行文献检索的两个数据库。Search queries & publication year:表示通过搜索关键词和出版年份(2012-2021)进行初步检索。1,261 publications:初步检索到的出版物总数。Pre-selection by title & abstract:基于标题和摘要进行的初步筛选过程。144 publications:初步筛选后剩余的出版物数量。Detailed reading & exclusion criteria:对剩余出版物进行详细阅读并应用排除标准。81 publications for review:最终用于系统综述的出版物数量。
4.2.4. 出版物分布分析
最终选定的81篇出版物中,大部分(69%)发表在期刊上,31%发表在科学会议论文集上。Figure 3 展示了每年出版物的数量。

Figure 3. 每年出版物数量分布(文献检索于2021年6月29日进行)
符号解释:
-
横轴:出版年份,从2012年到2021年。
-
纵轴:每年发表的出版物数量。
-
Number of publications per year:每年出版物数量的标题。 -
The literature search was performed on June 29, 2021:提示检索截止日期,因此2021年的数据可能不完整。分析: 从
Figure 3可以清晰看出,预测质量领域的研究出版物数量在过去几年中呈现持续增长的趋势,尤其是在2018年之后增长显著,2020年达到了峰值。这表明预测质量在制造业中的关注度和研究热度不断上升。
5. 实验设置
对于系统综述类论文而言,“实验设置”并非指传统的实证实验,而是指其进行综述和分析所依赖的“数据”(即所选取的学术论文)及其“分析框架”。因此,本节将侧重描述本文用于分析和评估所选论文的结构和依据。
5.1. 数据集
本综述的“数据集”是经过严格筛选后最终确定的81篇科学出版物。这些出版物发表于2012年至2021年间,全部涉及制造业中的 预测质量。Appendix A 的 Table 10 列出了所有这些被选中的出版物。
这些出版物构成了本研究的分析基础。它们包含了以下关键信息,作为本综述的“原始数据”:
- 论文标题和作者信息。
- 论文所属类型: 期刊文章或会议论文。
- 论文中描述的:
预测质量的具体用例和目的。- 涉及的制造过程及其DIN 8580分类。
- 被估计的质量标准。
- 所用过程数据的主要来源。
- 用于模型训练的输入变量。
- 收集到的数据类型或模态。
- 用于模型训练的数据量。
- 所制定的学习任务(分类或回归)。
- 主要使用的
ML/DL模型。 - 用于比较的基线
ML/DL模型。
5.2. 评估指标
本综述的“评估指标”并非传统的数值量化指标,而是其预设的研究问题 (Guiding Questions) 和根据这些问题制定的分类标准 (Categories)。研究团队通过对每篇选定论文进行细致阅读,并将其内容映射到这些预定义 Category 上,从而实现对整个领域的结构化评估和总结。
评估的“目标”是:
-
回答Q1: 识别
预测质量所涉及的制造过程类型和关注的质量标准,以揭示领域范围、应用多样性、相似性和存在的空白。 -
回答Q2: 描述用于模型训练的数据特征,包括数据来源、输入变量、数据模态和数据量,以理解数据在
预测质量中的角色和挑战。 -
回答Q3: 分析常用的
监督学习模型及其应用,包括学习任务、主要模型和基线模型,以了解当前研究的主流技术趋势和模型比较情况。通过这种系统化的分类和归纳,本文能够识别出
预测质量领域的关键洞察、现有差距和未来的研究方向。
5.3. 对比基线
对于系统综述而言,没有“对比基线”模型。此处“对比”的含义体现在对不同出版物中方法、数据和结果的横向比较。例如:
-
制造过程的分布比较: 哪些制造过程受到更多关注,哪些较少?
-
数据来源的偏好比较: 实验数据、真实生产数据、仿真数据或基准数据的使用频率如何?
-
输入变量类型的比较: 过程参数、传感器数据和产品测量在不同制造过程中如何组合使用?
-
机器学习模型的流行度比较: 哪些
ML/DL模型被用作“主要模型”,哪些常被用作“基线模型”?MLP和CNN的流行度相对于SVM或决策树如何?这种比较构成了综述的核心分析,旨在揭示领域内的趋势、主流实践和未被充分探索的领域。
6. 实验结果与分析
本章将根据本文的“结果”章节,围绕三个指导性问题(Q1、Q2、Q3)详细呈现和分析其对81篇文献的综述结果。
6.1. 核心结果分析
6.1.1. 制造过程类型和质量标准 (Q1)
预测质量 方法在多种制造过程中得到研究。论文根据DIN 8580:2003-09标准对这些过程进行了分类,该标准将过程分为六个主要组:初级成形 (Primary Shaping)、成形 (Forming)、切削 (Cutting)、连接 (Joining)、涂层 (Coating) 和材料性能改变 (Changing of Material Properties)。此外,由于存在涉及增材制造 (Additive Manufacturing)、装配 (Assembly) 过程或多阶段过程 (Multi-stage Processes) 的出版物,综述增加了这三类。
Figure 4 展示了每个工艺类别的出版物数量。

Figure 4. 各制造工艺类型出版物数量
分析:
-
不平衡分布: 从
Figure 4可以看出,不同工艺类别之间的研究活跃度存在显著不平衡。切削(Cutting) 过程的研究数量最多,达到26篇,其次是连接(Joining) 过程,有14篇。 -
未被充分研究的领域: 少数类别(如
涂层(Coating) 和初级成形(Primary Shaping))的研究数量相对较少,而材料性能改变(Changing of Material Properties) 类别甚至没有相关的出版物。这表明这些领域可能是未来研究的潜在空白。 -
新兴领域:
增材制造(Additive Manufacturing) 和装配(Assembly) 作为新兴或复杂的制造模式,也吸引了一定的研究关注。接下来,我们将详细分析主要的制造过程类别及其关注的质量标准。
以下是原文 Table 3 的结果:
| Category | Process | Quality criteria |
|---|---|---|
| Cutting | Turning (6) | Surface roughness (Acayaba & de Escalona, 2015; Du et al., 2021; Elangovan et al., 2015; Moreira et al., 2019; Tuar et al., 2017), machinability (Lutz et al., 2020) |
| Drilling (6) | Diameter (Neto et al., 2013), Schorr et al. 2020a, 2020b, surface roughness (Vrabel et al., 2016), hole defects (Jiao et al., 2020), surface gap (Bustillo et al., 2018) | |
| Laser cutting (4) | Surface roughness (Tercan et al., 2016, 2017; Zhang & Lei, 2017), kerf waviness (Nguyen et al., 2020) | |
| Milling (3) | Surface roughness (Hossain & Ahmad, 2014; Serin et al., 2020a), geometric deviation (de Oliveira Leite et al., 2015) | |
| Honing (2) | Curface roughness (Gejji et al., 2020; Klein et al., 2020) | |
| C. M. polishing (1) | Material removal rate (Yu et al., 2019) | |
| Diamond wire cutting (1) | Surface roughness (Kayabasi et al., 2017) | |
| Grinding (1) | Surface roughness (Varma et al., 2017) | |
| Laser micro grooving (1) | Groove geometry (Zahrani et al., 2020) | |
| Joining | Laser machining (1) | Dimensions (McDonnell et al., 2021) |
| Laser welding (4) | Weld bead dimensions (Ai et al., 2016; Lei et al., 2019), tensile strength (Yu et al., 2016), quality types (Yu et al., 2020) | |
| Resistance spot welding (3) | Tensile shear strength (Hamidinejad et al., 2012), tensile shear load bearing (Martín et al., 2016), welding deformation (Li et al., 2020a) | |
| Ultrasonic welding (3) | Quality types (Goldman et al., 2021; Li et al., 2020b), tensile strength (Natesh et al., 2019) | |
| Gas metal arc welding (2) | Weld penetration (Gyasi et al., 2019), weld bead dimensions (Wang et al., 2021) | |
| Gluing (1) | Glue volume (Dimitriou et al., 2020) | |
| Welding (1) | Residual stress (Dhas & Kumanan, 2014) |
切削 (Cutting):
切削过程在预测质量研究中占据主导地位 (26篇)。- 主要质量标准: 表面粗糙度 (Surface Roughness) 是最常见的预测目标,例如在车削 (Turning)、铣削 (Milling)、珩磨 (Honing)、金刚石线切割 (Diamond Wire Cutting) 和激光切割 (Laser Cutting) 中。其他如孔径 (Hole Diameter)、孔缺陷 (Hole Defects)、几何偏差 (Geometric Deviation) 和材料去除率 (Material Removal Rate) 也被研究。
- 示例: 在车削中,
ML方法被用于基于传感器数据和/或机器参数估计粗糙度。激光切割中,也预测了表面粗糙度和割缝波纹度。
连接 (Joining):
-
连接过程是第二大研究领域 (14篇),主要集中在焊接(Welding) 应用。 -
主要质量标准: 焊接质量指标多样,包括拉伸强度 (Tensile Strength)、焊缝尺寸 (Weld Bead Dimensions)、残余应力 (Residual Stress) 以及质量类型分类。
-
示例: 激光焊接中,
ANN模型基于焊接参数或传感器数据预测拉伸强度和焊缝尺寸。点焊 (Spot Welding) 和超声波焊接 (Ultrasonic Welding) 也有类似研究。以下是原文 Table 4 的结果:
Process type Process Quality criteria Primary shaping Casting (3) Casting defects (Ferguson et al., 2018; Kim et al., 2018; Lee et al., 2018) Injection molding (3) Product dimensions (Ke & Huang, 2020), product weight (Ge et al., 2012), warpage (Alvarado-Iniesta et al., 2012) Plastics extrusion (2) Product geometry (Garcia et al., 2019), yield stress (Mulrennan et al., 2018) Spinning (2) Yarn strength (Nurwaha & Wang, 2012), sliver evenness (Abd-Ellatif, 2013) Forming Metal rolling (5) Surface defects (Li et al., 2018; Lieber et al., 2013; Liu et al., 2021; Yun et al., 2020), slab geometry (Stähl et al., 2019) Sheet metal forming (3) Part defects (Dib et al., 2020; Meyes et al., 2019), machine speed (Essien & Giannetti, 2020) Forging (1) Process feasibility (Ciancio et al., 2015) Textile draping (1) Shear deformation (Zimmerling et al., 2020) Additive manuf. Laser powder bed fusion (4) Geometric deviation (Zhu et al., 2020), inherent strain (Li & Anand, 2020), structural defects (Bartlett et al., 2020), single-track width (Gaikwad et al., 2020) Direct metal deposition (1) Volume porosity (Zhang et al., 2019a) Fused deposition modeling (2) Tensile strength (Zhang et al., 2018, 2019b) PLA 3D printing (1) Surface roughness (Li et al., 2019)
初级成形 (Primary Shaping):
- 涉及从无形材料生产有形体的过程 (10篇)。
- 主要质量标准: 铸造缺陷 (Casting Defects)、产品尺寸 (Product Dimensions)、产品重量 (Product Weight)、翘曲 (Warpage)、产品几何形状 (Product Geometry)、屈服应力 (Yield Stress)、纱线质量 (Yarn Quality) 等。
- 示例: 铸造中,
CNN基于X射线图像或MLP基于传感器数据检测铸造缺陷。注塑成型 (Injection Molding) 中,预测产品尺寸或重量。
成形 (Forming):
- 涉及在不添加或去除材料的情况下改变零件形状的过程 (10篇)。
- 主要质量标准: 表面缺陷 (Surface Defects)、板坯几何形状 (Slab Geometry)、零件缺陷 (Part Defects)、机器速度 (Machine Speed)、工艺可行性 (Process Feasibility)、剪切变形 (Shear Deformation) 等。
- 示例: 金属轧制 (Metal Rolling) 中,
CNN检测表面缺陷。板材成形 (Sheet Metal Forming) 中,预测零件缺陷和机器速度。
增材制造 (Additive Manufacturing):
-
涉及
预测质量的研究有8篇。 -
主要质量标准: 几何偏差 (Geometric Deviation)、固有应变 (Inherent Strain)、结构缺陷 (Structural Defects)、单道宽度 (Single-track Width)、体积孔隙率 (Volume Porosity)、拉伸强度 (Tensile Strength)、表面粗糙度 (Surface Roughness) 等。
-
示例: 在设计阶段,仿真数据用于训练
ANN预测固有应变或几何偏差。在实现阶段,基于光学测量或机器传感器进行质量预测。以下是原文 Table 5 的结果:
Process type Process Quality criteria Assembly Manual assembly (2) Operation success (Wagner et al., 2020; Sarivan et al., 2020) Screw fastening (1) Operation success (Martinez et al., 2020) SMT assembly (1) Component position (Schmitt et al., 2020a) Snap-fit assembly (1) Operation success (Doltsinis et al., 2020) Multi-stage Battery-cell manufacturing (1) Battery capacity and state of health (Turetskyy et al., 2021) Metal forming and machining (1) Product dimensions (Papananias et al., 2019) Production line (1) Quality types (Liu et al., 2020b) Textile manufacturing (1) Fabric defects (Jun et al., 2021) Coating Chemical vapor deposition (1) quality types (Hsu & Liu, 2021) Lacquering (1) Defect types (Thomas et al., 2018) Painting (1) Paint structure (Kebisek et al., 2020) Primer-sealer dispensing (1) Defect types (Oh et al., 2019)
装配 (Assembly):
- 有5篇出版物涉及
装配过程。 - 主要质量标准: 主要关注成功和不成功装配任务的分类,如手动装配中的操作成功 (Operation Success)、SMT 装配中的组件位置 (Component Position)。
- 示例: 通过虚拟质量检测系统检测手动装配中的功能产品或
SMT装配中的正确位置。
涂层 (Coating):
- 有4篇出版物涉及
涂层过程。 - 主要质量标准: 质量类型、缺陷类型 (Defect Types)、涂层结构 (Paint Structure) 等。
- 示例: 在点胶 (Dispensing) 过程中,
SVM用于实时视觉质量检测。
多阶段 (Multi-stage):
- 有4篇出版物涉及多个制造过程组成的多阶段过程。
- 主要质量标准: 电池容量和健康状态 (Battery Capacity and State of Health)、产品尺寸 (Product Dimensions)、质量类型 (Quality Types)、织物缺陷 (Fabric Defects) 等。
- 挑战: 增加了数据源的复杂性和数量。
- 示例:
DL方法用于基于多模态传感器数据预测大型生产线的质量。
6.1.2. 数据基础和特征 (Q2)
预测质量 严重依赖数据。本节将回答关于数据源、数据量、输入变量和数据模态的问题。
6.1.2.1. 数据集来源和数据量
论文确定了三种主要数据来源:来自实际制造过程的真实数据、来自仿真的虚拟数据,以及来自基准或竞赛的公开数据集。
-
真实数据 (Real Data):从物理制造过程中收集。
- 运行生产 (Running Production):从持续运行的生产线中获取的历史数据。
- 实验数据 (Experimental Data):通过预定义实验设计生成的数据。
-
虚拟数据 (Virtual Data):通过仿真模拟生成。
-
基准/竞赛数据 (Benchmark/Competition Data):公开可用的数据集。
Table 6列出了所有出版物的数据来源。
以下是原文 Table 6 的结果:
| Data source | Publications |
|---|---|
| Simulation | Alvarado-Iniesta et al. (2012), Ciancio et al. (2015), Dib et al. (2020), Li and Anand (2020), Tercan et al. (2016, 2017), Zhu et al. (2020), Zimmerling et al. (2020) |
| Benchmark/competition | Ferguson et al. (2018), Jun et al. (2021), Liu et al. (2020b, 2021), Yu et al. (2019) |
| Real data (running production) | Essien and Giannetti (2020), Goldman et al. (2021), Kebisek et al. (2020), Lee et al. (2018), Li et al. (2018), Meyes et al. (2019), Oh et al. (2019), Schmitt et al. (2020a), Sthl et al. (2019), Wagner et al. (2020), Yun et al. (2020) |
| Real data (experimental) | Acayaba and de Escalona (2015), Ai et al. (2016), Bartlett et al. (2020), Bustillo et al. (2018), Dhas and Kumanan (2014), Dimitriou et al. (2020), Doltsinis et al. (2020), Du et al. (2021), Elangovan et al. (2015), Gaikwad et al. (2020), Garcia et al. (2019), Gejji et al. (2020), Zahrani et al. (2020), Gyasi et al. (2019), Hamidinejad et al. (2012), Hossain and Ahmad (2014), Hsu and Liu (2021), Jiao et al. (2020), Kayabasi et al. (2017), Ke and Huang (2020), Kim et al. (2018), Klein et al. (2020), Li et al. (2019, 2020a, 2020b), Lutz et al. (2020), Mulrennan et al. (2018), Lei et al. (2019), de Oliveira Leite et al. (2015), Lieber et al. (2013), Martín et al. (2016), Martinez et al. (2020), McDonnell et al. (2021), Moreira et al. (2019), Natesh et al. (2019), Neto et al. (2013), Nguyen et al. (2020), Papananias et al. (2019), Sarivan et al. (2020), Schorr et al. (2020a, 2020b), Serin et al. (2020a), Thomas et al. (2018), Turetskyy et al. (2021), Varma et al. (2017), Vrabel et al. |
数据源分析:
-
真实实验数据 (Real Data (experimental)):
真实实验数据是最主要的数据来源,占所有出版物的大多数 (65%)。研究通常通过预定义实验在受控条件下生成数据。 -
运行生产数据 (Real Data (running production)):有14%的出版物使用
运行生产数据,这些数据通常是在较长时期内从实际生产线收集的。 -
仿真数据 (Simulation Data):10%的出版物使用
仿真数据,主要用于验证ML驱动的预测质量的可行性,或在过程设计中节省成本和时间。 -
基准/竞赛数据 (Benchmark/Competition Data):仅有6%的出版物使用公开可用的
基准数据。Figure 5展示了不同数据来源下用于模型训练和评估的数据样本数量分布。
Figure 5. 用于模型训练和评估的数据样本数量分布(对数坐标)数据量分析:
-
实验数据量: 多数使用
真实实验数据的出版物(蓝色条)使用的样本量较小,集中在100个左右。平均样本量约为5,600,中位数仅为144。这表明许多研究是在有限的数据量上进行的,可能更多是为了演示预测质量的潜力。 -
运行生产数据量: 相比之下,使用
运行生产数据的出版物(红色条)通常具有更大的数据集,平均包含73,984个数据样本。最大的数据集包含525,600个样本。 -
仿真和基准数据量:
仿真数据集的样本量差异很大,从30个到超过22,000个不等。基准数据集平均包含5,722个样本或图像,但通过数据增强 (Data Augmentation) 可以显著增加训练数据量。
6.1.2.2. 输入变量
产品质量受多种因素影响,预测质量 模型通过将这些输入因素与质量关联起来。论文识别了三种主要输入变量类型:过程参数、传感器数据和产品测量。
Table 7 提供了所有出版物中使用的输入变量类型概览。
以下是原文 Table 7 的结果:
| Variable type | Publications |
|---|---|
| Process parameters (30) | Acayaba and de Escalona (2015), Ai et al. (2016), Alvarado-Iniesta et al. (2012), Bustillo et al. (2018), Ciancio et al. (2015), Dhas and Kumanan (2014), Dib et al. (2020), Ge et al. (2012), Gejji et al. (2020), Zahrani et al. (2020), Hamidinejad et al. (2012), Hossain and Ahmad (2014), Jiao et al. (2020), Kayabasi et al. (2017), Kebisek et al. (2020), Mulrennan et al. (2018), Lei et al. (2019), Li and Anand (2020), Martín et al. (2016), McDonnell et al. (2021), Natesh et al. (2019), Nguyen et al. (2020), Serin et al. (2020a), Tercan et al. (2016, 2017), Varma et al. (2017), Yu et al. (2020), Zhang and Lei (2017), Zhu et al. (2020), Zimmerling et al. (2020) |
| Sensor Data (22) | Essien and Giannetti (2020), Doltsinis et al. (2020), Du et al. (2021), Garcia et al. (2019), Goldman et al. (2021), Gyasi et al. (2019), Hsu and Liu (2021), Kim et al. (2018), Lee et al. (2018), Li et al. (2019, 2020a, 2020b), Lieber et al. (2013), Meyes et al. (2019), Moreira et al. (2019), Neto et al. (2013), Nurwaha and Wang (2012), Papananias et al. (2019), Sarivan et al. (2020), Schorr et al. 2020a, 2020b, Turetskyy et al. (2021) |
| Sensor data + process parameters (9) | Elangovan et al. (2015); Ke and Huang (2020), Klein et al. (2020), Lutz et al. (2020), Thomas et al. (2018), Vrabel et al. (2016), Yu et al. (2016), Zhang et al. (2018, 2019b) |
| Product measurements (16) | Bartlett et al. (2020), Dimitriou et al. (2020), Ferguson et al. (2018), Gaikwad et al. (2020), Jun et al. (2021), de Oliveira Leite et al. (2015), Li et al. (2018), Liu et al. (2021), Martinez et al. (2020), Oh et al. (2019), Schmitt et al. (2020a), Sthl et al. (2019), Tuar et al. (2017), Wang et al. (2021), Yun et al. (2020), Zhang et al. (2019a) |
输入变量类型分析:
-
过程参数 (Process Parameters):30篇出版物主要使用
过程参数。这些是为生产特定产品而设置的参数,通常在生产过程中不发生变化。例如,切削过程中的进给率 (Feed Rate)、切削速度 (Cutting Speed),激光应用中的激光功率 (Laser Power),塑料制造中的过程时间和温度。 -
传感器数据 (Sensor Data):22篇出版物主要使用
传感器数据。这些数据在制造过程中从过程或机器中实时获取,反映了过程的实际状态或机器的状况。例如,焊接电流、温度和压力数据、振动、扭矩或力传感器数据。 -
过程参数 + 传感器数据 (Sensor data + Process Parameters):9篇出版物结合了
过程参数和传感器数据。研究表明,结合使用这两种数据类型可以显著提高模型性能。 -
产品测量 (Product Measurements):16篇出版物使用
产品测量数据。这些是在产品生产过程中或视觉检测中获取的测量数据,常用于自动检测产品缺陷。其中一半以上是相机捕捉的图像。Figure 6展示了在最常见的九种制造工艺中,三种输入变量类型(过程参数、传感器数据、产品测量)的出现次数。
Figure 6. 输入变量类型在所涉及制造过程中的出现次数(仅考虑使用真实数据(实验或运行生产)的出版物)制造工艺与输入变量关系分析:
-
多样性: 即使对于相同的制造过程,也可以使用不同的数据进行质量估计。例如,在车削 (Turning) 过程中,既有基于机器参数的方法,也有使用振动信号等传感器数据的方法。
-
特定偏好: 某些工艺倾向于特定类型的输入变量。例如,车削和钻孔 (Drilling) 应用同时使用参数和传感器数据,而激光切割 (Laser Cutting) 应用主要使用过程参数。
-
产品测量的重要性: 在金属轧制 (Metal Rolling) 中,4/5的出版物仅基于
产品测量进行质量估计,这突出了视觉检测的重要性。
6.1.2.3. 数据模态
输入变量最终被转换为数据模态,用于训练 机器学习 模型。本综述识别了四种主要数据模态。Table 8 列出了这些数据类型及其在出版物中的出现情况。
以下是原文 Table 8 的结果:
| Variable Type | Publications |
|---|---|
| Categorical/discrete | Lee et al. (2018), Liu et al. (2020b), Lutz et al. (2020), Thomas et al. (2018) |
| Time Series | Essien and Giannetti (2020), Goldman et al. (2021), Gyasi et al. (2019), Hsu and Liu (2021), Meyes et al. (2019), Sarivan et al. (2020), Sthl et al. (2019), Zhang et al. (2018), Zhang et al. (2019b) |
| Image | Bartlett et al. (2020), Dimitriou et al. (2020), Ferguson et al. (2018), Jun et al. (2021), Li et al. (2018), Liu et al. (2021), Martinez et al. (2020), Oh et al. (2019), Wang et al. (2021), Yun et al. (2020), Zhang et al. (2019a) |
| Continuous/numerical | Abd-Ellatif (2013), Acayaba and de Escalona (2015), Ai et al. (2016), Alvarado-Iniesta et al. (2012), Bustillo et al. (2018), Ciancio et al. (2015), Dhas and Kumanan (2014), Dib et al. (2020), Doltsinis et al. (2020), Du et al. (2021), Elangovan et al. (2015), Gaikwad et al. (2020), Garcia et al. (2019), Ge et al. (2012), Gejji et al. (2020), Zahrani et al. (2020), Hamidinejad et al. (2012), Hossain and Ahmad (2014), Jiao et al. (2020), Kayabasi et al. (2017), Ke and Huang (2020), Kebisek et al. (2020), Kim et al. (2018), Klein et al. (2020), Mulrennan et al. (2018), Lee et al. (2018), Lei et al. (2019), de Oliveira Leite et al. (2015), Li et al. (2019, 2020a, 2020b), Li and Anand (2020), Lieber et al. (2013), Liu et al. (2020b), Lutz et al. (2020), Martín et al. (2016), McDonnell et al. (2021), Moreira et al. (2019), Natesh et al. (2019), Neto et al. (2013), Nguyen et al. (2020), Nurwaha and Wang (2012), Papananias et al. (2019), Schmitt et al. (2020a), Schorr et al. (2020a, 2020b), Serin et al. (2020a), Tercan et al. (2017), Tercan et al. (2016), Thomas et al. (2018), Turetskyy et al. (2021), Tuar et al. (2017), Varma et al. (2017), Vrabel et al. (2016), Yu et al. (2016) |
数据模态分析:
- 分类/离散数据 (Categorical/Discrete Data):最不常见,通常是非数值表示,如工具类型、材料批次、成分元素。
- 时间序列数据 (Time Series Data):9篇出版物使用
时间序列数据。绝大多数来自传感器数据,可以是单变量或多变量时间序列。 - 图像数据 (Image Data):11篇出版物使用
图像数据,主要为二维图像,用于产品测量。一些研究通过数据增强技术(如添加噪声、旋转、随机裁剪)来扩充图像数据集,以支持深度学习模型的训练。也有使用三维点云 (3D Point Clouds)。 - 连续/数值数据 (Continuous/Numerical Data):绝大多数出版物几乎只使用
连续/数值数据。这些数据包括参数设置值,以及从传感器和测量中获取的数值量。通常,传感器数据会被转换为标量数值(例如通过统计特征提取或专家驱动的聚合)。
6.1.3. 机器学习方法 (Q3)
本节考察 预测质量 中使用的学习任务和 机器学习 模型。学习任务由质量目标和待估计的质量变量决定。
- 学习任务: 30篇出版物涉及
分类任务,51篇涉及数值预测(即回归) 任务。 - 模型选择: 模型选择取决于数据模态以及输入和输出之间关系的复杂性。
- 模型比较: 49%的出版物(40/81)仅评估单一模型或同一模型的不同变体。51%的出版物(41/81)在实验中比较了多个模型。
-
主要模型 (Prime Model):论文聚焦的(单一模型)或模型比较中表现最佳的模型。
-
基线模型 (Baseline Models):用于比较的所有其他模型。
Table 9列出了所有出版物中使用的主要模型和涉及的学习任务。
-
以下是原文 Table 9 的结果:
| Learning task ML-model | Publications | |
|---|---|---|
| Classification | CNN | Ferguson et al. (2018), Goldman et al. (2021), Hsu and Liu (2021), Jun et al. (2021), Li et al. (2018), Liu et al. (2021), Martinez et al. (2020), Sarivan et al. (2020), Yun et al. (2020), Zhang et al. (2019a) |
| Decision tree | Tercan et al. (2016, 2017) | |
| Ensemble model | Gejji et al. (2020), Kim et al. (2018), Thomas et al. (2018) | |
| K-NN | Lieber et al. (2013) | |
| MLP | Bustillo et al. (2018), Dib et al. (2020), Ke and Huang (2020), Kebisek et al. (2020), Lee et al. (2018), Wagner et al. (2020), Yu et al. (2020) | |
| Naive Bayes | Bartlett et al. (2020) | |
| Random forest | Zahrani et al. (2020) | |
| RNN | Liu et al. (2020b), Meyes et al. (2019) | |
| SVM | Doltsinis et al. (2020), Oh et al. (2019), Schmitt et al. (2020a) | |
| Regression | ANFIS | Hossain and Ahmad (2014), Moreira et al. (2019), Varma et al. (2017), Zhang and Lei (2017) |
| CNN | Dimitriou et al. (2020), Wang et al. (2021), Zhu et al. (2020), Zimmerling et al. (2020) | |
| Ensemble model | Li et al. (2019) | |
| Extra tree | Schorr et al. (2020a) | |
| EML | Nguyen et al. (2020) | |
| GA-BPNN | Ai et al. (2016) | |
| Linear regression | Elangovan et al. (2015) | |
| MLP | Abd-Ellatif (2013), Acayaba and de Escalona (2015), Ciancio et al. (2015), Du et al. (2021), Gyasi et al. (2019), Hamidinejad et al. (2012), Jiao et al. (2020), Kayabasi et al. (2017), Lei et al. (2019), de Oliveira Leite et al. (2015), Li et al. (2020a, 2020b), Li and Anand (2020), Lutz et al. (2020), McDonnell et al. (2021), Natesh et al. (2019), Neto et al. (2013), Nurwaha and Wang (2012), Papananias et al. (2019), Serin et al. (2020a), Turetskyy et al. (2021), Vrabel et al. (2016), Yu et al. (2016) | |
| NN-GA-PSO | Dhas and Kumanan (2014) | |
| Quadratic regression | Martín et al. (2016) | |
| Random forest | Klein et al. (2020), Mulrennan et al. (2018), Schorr et al. (2020b), Tuar et al. (2017), Yu et al. (2019) | |
| Relevance vector machine | Ge et al. (2012) | |
| RNN | Alvarado-Iniesta et al. (2012), Essien and Giannetti (2020), Stähl et al. (2019), Zhang et al. (2018), Zhang et al. (2019b) | |
| SeDANN | Gaikwad et al. (2020) | |
| SVM | Garcia et al. (2019) |
主要模型分析:
-
多层感知器 (Multilayer Perceptron, MLP):最常用的主要模型,在30篇出版物中出现。其受欢迎度在2020和2021年依然很高。
MLP适用于分类(如预测故障类型、OK/NOK状态)和回归(如估计表面粗糙度、拉伸强度)。 -
卷积神经网络 (Convolutional Neural Network, CNN):第二常用的模型 (14篇)。
CNN擅长高维和空间数据的模式识别,因此广泛应用于图像数据(如缺陷分类)和时间序列数据。 -
循环神经网络 (Recurrent Neural Network, RNN):7篇出版物使用
RNN作为主要模型,特别适合处理时间相关或序列数据,如传感器时间序列数据。长短期记忆网络 (LSTM)是RNN的主流架构。Figure 7展示了2020年和2021年出版物中ML主要模型的使用比例。
Figure 7. 2020年和2021年出版物中 ML主要模型的使用比例分析:
-
深度学习主导: 2020和2021年,
MLP和CNN占据了主要模型的68%份额,凸显了深度学习模型在预测质量领域的强势地位。 -
其他模型:
RNN占5%,其他模型(如SVM、Random Forest、Decision Tree)合计占27%。Figure 8展示了ML模型作为基线模型在所有出版物中出现的次数。
Figure 8. ML模型作为基线模型在所有出版物中出现的次数基线模型分析:
-
传统
ML模型:SVM、Random Forest和Decision Tree等传统机器学习模型常被用作基线模型进行比较。这表明研究人员在提出新模型时,通常会与这些成熟的非线性学习问题解决方案进行对比。
模型与数据模态的关系:
- 图像数据: 如果数据基础是图像,大多数出版物(9/11)使用
CNN为基础的方法。 - 数值/连续数据:
MLP在大约一半的相应出版物中使用,其次是Random Forest、SVM等。 - 时间序列数据: 尚未建立统一的主流模型。一种常见方法是将原始时间序列数据通过特征提取转换为数值/连续变量,然后训练
机器学习模型。直接在时间序列上训练的模型中,有5篇使用LSTM,3篇使用CNN。
6.2. 数据呈现 (表格)
由于原文提供了多个表格来支撑其结果分析,本节将按照指令,将所有相关表格完整转录。
6.2.1. 文献检索方法论的分类标准 (Table 1)
已在 4.2.1. 分类标准 小节转录。
6.2.2. 文献检索的搜索词 (Table 2)
已在 4.2.2. 文献检索策略 小节转录。
6.2.3. 切削和连接过程及质量标准 (Table 3)
已在 6.1.1. 制造过程类型和质量标准 (Q1) 小节转录。
6.2.4. 初级成形、成形和增材制造过程及质量标准 (Table 4)
已在 6.1.1. 制造过程类型和质量标准 (Q1) 小节转录。
6.2.5. 装配、多阶段和涂层过程及质量标准 (Table 5)
已在 6.1.1. 制造过程类型和质量标准 (Q1) 小节转录。
6.2.6. 用于训练机器学习模型的过程数据主要来源 (Table 6)
已在 6.1.2.1. 数据集来源和数据量 小节转录。
6.2.7. 用于预测质量模型的输入变量类型 (Table 7)
已在 6.1.2.2. 输入变量 小节转录。
6.2.8. 用于训练 ML 和 DL 模型的数据集模态 (Table 8)
已在 6.1.2.3. 数据模态 小节转录。
6.2.9. 所有出版物中涉及的学习任务和使用的主要模型概览 (Table 9)
已在 6.1.3. 机器学习方法 (Q3) 小节转录。
6.2.10. 附录 A: 文献列表 (Table 10)
以下是原文 Table 10 的结果:
| Publication | Type | Name |
|---|---|---|
| Alvarado-Iniesta et al. (2012) | Journal | Journal of Applied Research and Technology |
| Ge et al. (2012) | Journal | Industrial Engineering & Chemistry Research |
| Nurwaha and Wang (2012) | Journal | Fibres & Textiles in Eastern Europe |
| Hamidinejad et al. (2012) | Journal | Materials and Design |
| Lieber et al. (2013) | Conference | CIRP Conference on Manufacturing Systems |
| Neto et al. (2013) | Conference | CIRP Conference on Intelligent Computation in Manufacturing Engineering |
| Abd-Ellatif (2013) | Conference | Alexandria Engineering Journal |
| Dhas and Kumanan (2014) | Journal | Applied Soft Computing |
| Hossain and Ahmad (2014) | Journal | International Conference on Mechanical Engineering |
| Ciancio et al. (2015) | Conference | CIRP Conference on Intelligent Computation in Manufacturing Engineering |
| Acayaba and de Escalona (2015) | Journal | CIRP Journal of Manufacturing Science and Technology |
| Elangovan et al. (2015) | Conference | International Symposium on Big Data and Cloud Computing |
| de Oliveira Leite et al. (2015) | Journal | Applied Soft Computing |
| Vrabel et al. (2016) | Conference | CIRP Conference on Manufacturing Systems |
| Martín et al. (2016) | Journal | Materials Science & Engineering: A |
| Tercan et al. (2016) | Conference | Changeable, Agile, Reconfigurable & Virtual Production Conference |
| Yu et al. (2016) | Journal | Journal of Mechanical Science and Technology |
| Ai et al. (2016) | Journal | Optics and Lasers in Engineering |
| Kayabasi et al. (2017) | Journal | Solar Energy |
| Varma et al. (2017) | Journal | Material Today: Proceedings |
| Tuar et al. (2017) | Journal | Applied Soft Computing |
| Tercan et al. (2017) | Journal | Production Engineering |
| Zhang and Lei (2017) | Conference | Global Congress on Manufacturing and Management |
| Bustillo et al. (2018) | Journal | Journal of Manufacturing Systems |
| Ferguson et al. (2018) | Journal | Smart and Sustainable Manufacturing Systems |
| Li et al. (2018) | Conference | IFAC Workshop on Mining, Mineral and Metal Processing |
| Zhang et al. (2018) | Conference | International Conference on Through-life Engineering Services |
| Kim et al. (2018) | Journal | International Journal of Computer Integrated Manufacturing |
| Lee et al. (2018) | Journal | Sensors |
| Mulrennan et al. (2018) | Journal | Polymer Testing |
| Thomas et al. (2018) | Journal | Computers in Industry |
| Zhang et al. (2019a) | Journal | Additive Manufacturing |
| Gyasi et al. (2019) | Conference | International Conference on Flexible Automation and |
| Garcia et al. (2019) | Journal | Intelligent Manufacturing Journal of Intelligent Manufacturing |
| Zhang et al. (2019b) | Journal | Computers in Industry |
| Li et al. (2019) | Journal | Robotics and Computer-Integrated Manufacturing |
| Natesh et al. (2019) | Journal | Measurement |
| Moreira et al. (2019) | Journal | Computers & Industrial Engineering |
| Papananias et al. (2019) | Conference | CIRP Conference on Modelling of Machining Operations |
| Stähl et al. (2019) | Journal | Applied Mathematical Modelling |
| Oh et al. (2019) | Journal | Reliability Engineering and System Safety |
| Meyes et al. (2019) | Conference | North American Manufacturing Research Conference |
| Yu et al. (2019) | Journal | Wear |
| Lei et al. (2019) | Journal | Journal of Manufacturing Processes |
| Gejji et al. (2020) | Conference | International Conference Interdisciplinarity in Engineering |
| Gaikwad et al. (2020) | Journal | Additive Manufacturing |
| Lutz et al. (2020) | Conference | CIRP Conference on Manufacturing Systems |
| Zimmerling et al. (2020) | Conference | International Conference on Material Forming |
| Dib et al. (2020) | Journal | Neural Computing and Applications |
| Dimitriou et al. (2020) | Journal | IEEE Transactions on Industrial Electronics |
| Doltsinis et al. (2020) | Journal | IEEE Transactions on Automation Science and Engineering |
| Zahrani et al. (2020) | Conference | CIRP Conference on Photonic Technologies |
| Essien and Giannetti (2020) | Journal | IEEE Transactions on Industrial Informatics |
| Serin et al. (2020a) | Conference | International Conference on Flexible Automation and Intelligent Manufacturing |
| Sarivan et al. (2020) | Conference | International Conference on Flexible Automation and Intelligent Manufacturing |
| Bartlett et al. (2020) | Journal | Materials Science & Engineering: A |
| Jiao et al. (2020) | Journal | Applied Sciences |
| Yun et al. (2020) | Journal | Journal of Manufacturing Systems |
| Ke and Huang (2020) | Journal | Polymers |
| Li et al. (2020a) | Journal | Scanning |
| Li et al. (2020b) | Journal | Materials and Design |
| Liu et al. (2020b) | Journal | Journal of Intelligent Manufacturing |
| Li and Anand (2020) | Journal | Journal of Manufacturing Processes |
| Kebisek et al. (2020) | Journal | IFAC-PapersOnLine |
| Martinez et al. (2020) | Journal | International Journal of Advanced Manufacturing Technology |
| McDonnell et al. (2021) | Journal | Journal of Intelligent Manufacturing |
| Wagner et al. (2020) | Conference | CIRP Conference on Computer Aided Tolerancing |
| Schmitt et al. (2020a) | Journal | Advanced Engineering Informatics |
| Schorr et al. (2020a) | Conference | CIRP Conference on Manufacturing Systems |
| Schorr et al. (2020b) | Conference | North American Manufacturing Research Conference |
| Klein et al. (2020) | Conference | CIRP Conference on Manufacturing Systems |
| Nguyen et al. (2020) | Journal | Optics and Lasers in Engineering |
| Yu et al. (2020) | Journal | Metals |
| Zhu et al. (2020) | Conference | CIRP Design |
| Turetskyy et al. (2021) | Journal | Energy Storage Materials |
| Goldman et al. (2021) | Conference | International Conference on Industry 4.0 and Smart |
| Du et al. (2021) | Journal | Manufacturing Advances in Manufacturing |
| Hsu and Liu (2021) | Journal | Journal of Intelligent Manufacturing |
| Jun et al. (2021) | Journal | Textile Research Journal |
| Wang et al. (2021) | Journal | Journal of Manufacturing Processes |
| Liu et al. (2021) | Journal | Optics and Lasers in Engineering |
符号解释:
Publication:出版物的第一作者及出版年份标识。Type:出版物类型,Journal (期刊) 或 Conference (会议)。Name:出版物所属的期刊或会议名称。
7. 总结与思考
7.1. 结论总结
本文对2012年至2021年间制造业中基于 机器学习 和 深度学习 的 预测质量 研究进行了全面系统的综述,揭示了该领域的现状、主要方法和存在的挑战。
在制造过程和质量标准方面 (Q1):
预测质量在制造业的广泛过程中得到应用,用于估计各种质量指标或缺陷类型。- 研究分布不平衡,
切削和连接过程是研究热点,而涂层和材料性能改变等过程研究较少。这可能与各领域数字化程度和数据可用性有关。 - 应用场景主要包括过程设计支持与优化、生产过程中的在线质量预测和视觉质量检测。
在数据基础和特征方面 (Q2):
- 大多数研究使用来自实际制造过程的数据,其中以实验生成数据为主,但其数据量通常较小。来自运行生产的数据集通常更大。
- 输入变量类型多样,包括过程参数、传感器数据和产品测量,有时也结合使用。研究表明,组合使用参数和传感器数据可以显著提高性能。
- 数据模态以
连续/数值数据和图像数据扮演越来越重要的角色,时间序列数据也有一定应用。
在机器学习方法方面 (Q3):
-
多层感知器 (MLP)和卷积神经网络 (CNN)是最受欢迎的ML/DL模型,尤其是在近年来的研究中占据主导地位。MLP具有通用性,CNN则擅长处理图像数据。 -
循环神经网络 (RNN)尤其是LSTM,被用于处理时间序列数据。 -
约一半的出版物会将其主要模型与
支持向量机 (SVM)、随机森林 (Random Forest)等其他ML模型进行基线比较。总体而言,
预测质量是一个高度活跃和异构的研究领域,机器学习和深度学习方法在质量保证和检测中展现出巨大潜力。
7.2. 局限性与未来工作
论文作者从综述结果中凝练出了当前 预测质量 研究的局限性,并提出了未来研究方向:
7.2.1. 场景和制造领域
- 应用范围不平衡:
切削和连接过程研究较多,而材料性能改变领域几乎没有研究。其他重要分支如铆接、胶合、钎焊也鲜有提及。 - 过程集成不足: 尽管模型在实验中表现良好,但在大多数情况下,它们并未真正集成到制造过程中。模型训练、评估和使用大多离线进行,缺乏对真实生产环境中
预测质量实施和部署的深入讨论。 - 缺乏影响评估: 很少有研究评估
预测质量方法对过程质量的实际影响,例如通过质量导向的指标(如废品率降低、良品率提高)进行评估。
7.2.2. 数据基础和特性
- 输入变量单一: 许多方法依赖单一类型的输入变量。尽管有研究表明结合过程参数和传感器数据能显著提升性能,但
产品设计或材料特性等其他重要变量常被忽视。 - 产品特异性: 大多数
ML模型是针对单一产品类型训练的,如何将为单个产品训练的模型应用于其他产品仍是开放问题。 - 数据量和代表性: 许多方法在小规模实验数据上开发和评估,这些数据虽然能涵盖边界条件,但通常代表性不足。数据稀疏性是制造业中的一大挑战。
- 缺乏基准数据集: 绝大多数出版物不使用公开可用的基准数据集,也不提供自己的数据库或源代码。这导致不同方法之间缺乏可比性,阻碍了研究的再现性和进一步发展。
- 数据增强主要限于图像: 尽管
数据增强是一种有前景的解决方案,但目前主要应用于图像数据,对传感器和时间序列数据应用较少。
7.2.3. 机器学习方法
- 模型多样性有限:
深度学习模型主要集中在CNN和LSTM。像Transformer网络和图神经网络 (GNN)等新兴的深度学习模型在预测质量领域应用不足。 - 时间序列处理: 缺乏针对原始传感器或时间序列数据的统一
深度学习模型方法。
7.2.4. 未来研究方向
基于以上挑战,论文提出了以下未来研究方向:
- 合成数据生成 (Synthetic Data Generation): 利用生成式
深度学习模型(如GAN)生成大量逼真的合成训练数据,以解决数据稀疏性问题,尤其是在稀有过程变异和产品缺陷方面。 - 基准数据集 (Benchmark Data Sets): 建立公开可用的
预测质量基准数据集,以促进不同方法之间的可比性和研究的再现性。 - 新型深度学习方法 (Novel Deep Learning Methods): 探索
Transformer网络(用于序列和图像数据) 和图神经网络 (GNN)(用于CAD或仿真数据) 等新兴深度学习模型在预测质量中的应用潜力。 - 时间序列分类和预测 (Time Series Classification and Forecasting): 深入研究针对原始传感器或时间序列数据的
深度学习模型,以实现更直接、有效的质量预测。 - 迁移学习和持续学习 (Transfer Learning and Continual Learning): 研究如何利用
迁移学习和持续学习来应对生产过程的持续变化,提高模型的数据效率和成本效益,减少在新产品或过程变体出现时重新训练的开销。 - 集成和部署 (Integration and Deployment): 开展更多研究,将
预测质量解决方案集成到真实的质量保证流程中,包括开发自动化反馈策略、使用质量导向指标评估影响,并研究MLOps(Machine Learning Operationalization) 策略以实现模型的持续监控、集成和交付。 - 认证 (Certification): 探索
预测质量过程的认证机制,以确保ML模型的可靠性,从而使其能够更广泛地应用于工业制造过程。
7.3. 个人启发与批判
这篇综述论文提供了对制造业 预测质量 领域当前研究状态的深刻洞察,对初学者和领域内研究者都具有重要价值。
7.3.1. 个人启发
- 系统性和全面性: 论文的系统综述方法本身就是一份优秀的研究范例。其详尽的文献检索、严格的筛选标准和多维度的分类框架,确保了综述的全面性和严谨性。对于初学者而言,这提供了一个清晰的路径来理解如何对一个研究领域进行系统性梳理。
- 揭示领域差距: 论文不仅总结了现有成果,更重要的是明确指出了当前研究的空白和挑战。例如,对数据稀疏性、缺乏基准数据、特定制造工艺研究不足以及模型部署集成问题的强调,为未来研究提供了明确的方向。
- 技术趋势洞察: 强调
MLP和CNN的主导地位,并指出Transformer等新兴DL模型的应用不足,这有助于研究人员把握技术前沿,将新的方法引入到预测质量领域。 - 实际应用导向: 论文提出的未来研究方向,特别是关于
合成数据生成、迁移学习、持续学习以及集成与部署的讨论,都紧密围绕预测质量在实际工业应用中面临的核心痛点,具有很强的实践指导意义。
7.3.2. 批判
-
对模型可解释性 (Interpretability) 的关注不足: 在制造业,尤其是涉及安全和高价值产品的生产中,
ML模型的可解释性往往与预测准确性同等重要,甚至更重要。当模型做出质量判断时,工程师和操作员需要理解其决策依据,以便采取正确的纠正措施。然而,这篇综述对可解释性的讨论相对较少,尽管它在未来研究方向中间接提到了对“洞察力”的需求,但并未将其作为一个独立的、关键的维度进行系统分析。这可能是一个值得未来综述或研究深入探讨的领域。 -
缺乏经济效益评估的呼吁: 尽管论文在
局限性部分提到了“缺乏使用质量导向指标(如废品率、良品率)评估方法影响的讨论”,但并未进一步强调对预测质量解决方案经济效益进行量化评估的重要性。在工业界,任何技术的引入最终都需要通过投资回报率 (ROI)来衡量其价值。未来的研究应更侧重于结合经济模型来评估预测质量的实际价值。 -
数据伦理和隐私: 随着
预测质量解决方案越来越多地依赖于敏感的生产数据,数据伦理和隐私保护在某些应用场景下可能成为关键问题,尤其是在多企业协作或数据共享的场景中。本文并未对此进行讨论。 -
模型鲁棒性 (Robustness) 和泛化能力 (Generalization Capability): 制造业环境复杂多变,模型在实验室环境下的优异表现可能在实际生产中因数据漂移 (Data Drift)、概念漂移 (Concept Drift) 等问题而失效。论文虽然提到了
持续学习和迁移学习来应对过程变化,但对模型鲁棒性和泛化能力的深入分析,以及如何设计能够抵御这些变化的预测质量系统,仍有进一步探讨的空间。综上所述,这篇论文是
预测质量领域的重要贡献,它清晰地描绘了该领域的图景,并为未来的研究指明了方向。通过解决其提出的挑战,并进一步考虑可解释性、经济效益和鲁棒性等方面,预测质量有望在工业4.0时代发挥更大的作用。
相似论文推荐
基于向量语义检索推荐的相关论文。