基于归纳偏置的物理信息机器学习
Physics Informed Machine Learning through Inductive Bias
Olga Fink¹, Vinay Sharma¹
¹ 洛桑联邦理工学院(EPFL)智能维护与运营系统,瑞士洛桑
E-mail: olga.fink@epfl.ch
现状
在智能制造中,物理信息机器学习(PIML)[1]正成为构建数据高效、物理一致、可解释且可信的人工智能系统的关键推动者。制造环境的特点是流程复杂、系统相互关联,且通常存在稀疏或噪声传感器数据[2]。PIML通过将领域知识——如控制方程、结构约束或物理对称性——直接嵌入学习过程来解决这些挑战。
PIML引入三类偏置以引导模型获得可泛化且物理合理的解:归纳偏置、观测偏置和学习偏置。归纳偏置是嵌入于模型架构中的先验假设——如空间局部性[3]、守恒定律[4]或时间连续性[5]——它们约束了解空间。观测偏置源于数据的采样或表示方式,而学习偏置则产生于优化策略,如正则化或特定损失函数。
在智能制造中,由于物理过程的复杂性和多样的传感器配置,归纳偏置发挥着尤为重要的作用。关于传感器位置(关系性)、时间动态和信号特性的知识可被有效地整合为归纳偏置,以增强模型的泛化能力、可解释性和数据效率[6]。它使得模型能够在有限数据下学习,同时确保预测结果符合已知的物理和操作约束。例如,嵌入热动力学、材料行为、磨损过程或守恒定律知识的模型,更适用于预测性维护、质量保证和控制[7][8]。归纳偏置同样增强了可解释性——这对操作人员信任和安全关键场景的部署至关重要。
归纳偏置的一个重要子类是结构偏置和关系偏置[3],它们在建模现代制造系统时日益重要,因为传感器测量往往表现出强烈的空间和时间相关性。结构偏置编码了关于系统层级化或模块化组织的假设,而关系偏置则捕捉组件之间的相互作用和相互依赖关系。图神经网络(GNN)天然能够利用这些偏置,并在智能制造中展现出强大的潜力。
GNN能够将机器、传感器和子系统建模为图中的节点,以边表示它们之间的物理、功能或空间关系。这使其非常适用于故障传播分析、根因诊断和系统级健康监测等任务。时空图神经网络[10]进一步融入了时间动态,使得跨分布式系统演变传感器数据的实时分析成为可能。
在智能制造中,GNN正越来越多地用作代理模型,以逼近复杂动力系统的行为——在这些系统中,直接仿真(如有限元或多物理场模型)计算成本极高[11][12][13]。通过从系统级传感器数据和已知组件相互作用中学习,GNN能够以高保真度模拟物理过程,从而实现快速、可扩展的诊断、控制和优化。
随着智能制造向互联的赛博物理环境演进,融合结构偏置和关系偏置——特别是通过基于GNN的PIML模型——将成为构建稳健、可扩展、透明的人工智能驱动决策系统的核心。
当前及未来挑战
代理建模是智能制造的关键推动者,为复杂的物理和赛博物理系统提供高效近似。这些模型对于实时应用至关重要——如系统诊断、控制和预测性维护——因为在这些场景中,完整规模的仿真(如有限元或多物理场模型)计算代价过于高昂。尽管前景广阔,代理模型仍面临若干与制造环境相关的开放性挑战。
一个主要需求是:在不断变化的操作条件下实现快速的在线动力学预测。模型必须在系统负载、速度或热状态发生变化时仍能提供可靠、实时的输出。此外,它们还须支持长轨迹滚动展开——即将模型输出反馈作为输入,迭代预测系统在未来长时间跨度内的状态——同时最小化误差累积,以确保预测在时间维度上的稳定性。
学习动态的可解释性和可说明性仍然至关重要。许多高性能模型表现为黑箱,使得验证或解释其输出变得困难——这在安全关键的制造环境中是不可接受的局限性。代理模型不仅需要准确,还须透明且具有物理意义。
工业系统天生具有噪声且数据丰富。模型必须处理噪声、异构的传感器输入,这些输入往往具有不同的采样率和分辨率。它们还须能够直接从观测轨迹中学习,即使在系统参数或控制方程未知的情况下,这要求强大的归纳偏置和关系偏置。
除鲁棒性和表达力之外,可扩展性同样必不可少。制造过程日益涉及多物理场相互作用(如热-机械耦合)和多保真度数据流——从高分辨率仿真到低质量实时传感器。代理模型必须连贯地整合这些信息,并在空间和时间分辨率上实现规模化。
最具挑战性的问题之一是泛化能力和外推能力。人们不仅期望代理模型在训练数据域内泛化,还期望它们能够外推到全新的系统配置和操作条件而无需重新训练。这在柔性或模块化制造场景中尤为重要,因为系统布局和用例不断演变。许多当前模型缺乏处理此类部署场景的适应性,尤其是在故障数据稀疏或不断演变的情况下[14]。
此外,逆参数推断——如从观测数据中识别过程条件、材料属性或系统级参数——以及退化、磨损或其他长期系统演化的显式建模,仍是重大挑战。这些局限性限制了代理模型在智能制造中的更广泛应用,而准确、可解释和动态的模型对于过程优化、自适应控制、质量保证和生命周期管理至关重要。
应对挑战的科学技术进展
物理信息图神经网络(PI-GNN)为解决上述挑战提供了一条有前景的路径。最近的发展将几何和物理归纳偏置集成到传统GNN中——从领域特定的物理先验(如基尔霍夫定律[15]或热通量连续性[16])到更广泛的原则,如对称性[17]、热力学定律[18]和动量守恒[4]——从而将传统GNN扩展为PI-GNN。这些物理归纳偏置增强了GNN固有的关系偏置,使得对组件间相互作用的建模既有物理基础又计算高效,带来了以下关键能力:
- 数据效率与长轨迹预测:物理感知的归纳偏置约束了假设空间,使模型能够从稀疏、噪声数据中准确学习,并防止长期预测中出现非物理的漂移。
- 泛化能力与外推能力:模块化相互作用学习和嵌入的物理知识增强了对未见拓扑、边界和操作制度的迁移能力。
- 可解释性与可说明性:物理定律指导消息传递机制,使成对相互作用能够表示有意义的内部变量(如应力或热通量),从而支持安全关键系统的透明度。
为充分实现PI-GNN作为生产级工具的潜力,研究须在以下三个关键领域取得进展:
1. 跨领域应用与通用物理信息先验:虽然某些近期的PI-GNN——如热力学一致性网络[18]和动量保持等变图网络[4]——显示出跨领域潜力,但大多数仍受限于领域特定的归纳偏置。要适用于耦合热-机械、机电和流-固系统,未来的架构必须将通用物理定律——能量、动量、质量和电荷守恒——直接嵌入其消息传递机制。
2. 虚拟传感:估计不可观测变量——如金属增材制造中的残余应力或高粘度混合器中的内部剪切力——对过程监测至关重要。由于这些量无法直接测量,具有强物理先验的PI-GNN能够从异构、多保真度数据中推断这些内部变量。其学习到的成对消息隐含地表示接触负载等量[5]。在物理定律(如动量守恒)的指导下,这些消息可被解码为来自可观测动态的可解释变量,支持自适应控制和缺陷预防。
3. 社区基准测试:推进智能制造中的PI-GNN研究需要基准数据集,这些数据集结合高保真仿真与跨不同操作条件的真实传感器数据。这些数据集应捕捉领域偏移、传感器噪声和过程变异性,以实现对泛化能力和鲁棒性的严格评估。来自专用试验台的内部状态测量——如接触负载——对推动虚拟传感尤为重要。
当这些关键进展被整合时,将为稳健、可解释、可扩展的PI-GNN模型奠定基础,使其作为跨多种系统类型的可靠数字代理模型发挥作用,以支持下一代智能制造环境中的更智能、更可持续的系统设计、实时监测和自适应控制。
结论
物理信息机器学习正成为构建数据高效、可解释且符合物理原理的人工智能系统的关键推动者——这是在具有复杂动态、稀疏传感和安全关键约束的智能制造环境中的必备要求。
虽然图神经网络本身并非物理信息驱动,但其为表示制造系统的结构化、关系性质提供了天然框架。当通过额外的广义基于物理的归纳偏置——如守恒定律、对称性或能量一致性——进行扩展时,GNN可以作为跨多物理场、多尺度环境有效的代理模型和推理引擎。
这些物理信息图神经网络在故障传播分析、虚拟传感、长时域控制和自适应监测等任务上展现出强大潜力。它们还提供了可微分、结构化的模型,可集成到现代控制架构中。
要充分实现这一潜力,还需要在泛化、外推、动态图适应和从仿真到现实的迁移等领域开展进一步研究。开发将仿真与传感器数据相结合的标准化基准测试至关重要。
随着智能制造向自主化、赛博物理系统演进,PI-GNN等物理引导学习框架将在构建稳健、可信的人工智能解决方案中发挥日益重要的作用。
致谢
本工作得到了瑞士国家科学基金会(SNSF)资助200021_200461的支持。
参考文献
[1] Karniadakis G E, Kevrekidis I G, Lu L, Perdikaris P, Wang S and Yang L 2021 Physics-informed machine learning Nat. Rev. Phys. 3 422–440 (doi: 10.1038/s42254-021-00314-5) Journal XX (XXXX) XXXXXX A Author et al 65
[2] Phuyal S, Bista D and Bista R 2020 Challenges, opportunities and future directions of smart manufacturing: A state-of-the-art review Sustain. Prod. Consump. 23 287–302 (doi: 10.1016/j.spc.2020.06.002)
[3] Battaglia P W, Hamrick J B, Bapst V, Sanchez-Gonzalez A, Zambaldi V, Malinowski M, Tacchetti A, Raposo D, Santoro A, Faulkner R et al 2018 Relational inductive biases, deep learning, and graph networks arXiv:1806.01261
[4] Sharma V and Fink O 2025 Dynami-CAL GraphNet: A physics-informed graph neural network conserving linear and angular momentum for dynamical systems arXiv:2501.07373
[5] Sharma V, Oddon R T, Tesini P, Ravesloot J, Taal C and Fink O 2025 Equi-Euler GraphNet: An equivariant, temporal- dynamics informed graph neural network for dual force and trajectory prediction in multi-body systems arXiv:2504.13768
[6] Zhu G, Wang S and Wang L 2024 Heterogeneous graph neural network for modeling intelligent manufacturing systems Meas. Sci. Technol. 36 015114
[7] Peng J-Z, Hua Y, Li Y-B, Chen Z-H, Wu W-T and Aubry N 2023 Physics-informed graph convolutional neural network for modeling fluid flow and heat convection Phys. Fluids 35 085104
[8] Xue T, Gan Z, Liao S and Cao J 2022 Physics-embedded graph network for accelerating phase-field simulation of microstructure evolution in additive manufacturing npj Comput. Mater. 8 201
[9] Zhao M, Taal C, Baggerohr S and Fink O 2025 Graph neural networks for virtual sensing in complex systems: Addressing heterogeneous temporal dynamics Mech. Syst. Signal Process. 230 112544
[10] Yu B, Yin H and Zhu Z 2018 Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting Proc. IJCAI 3634–3640
[11] Sanchez-Gonzalez A, Godwin J, Pfaff T, Ying R, Leskovec J and Battaglia P 2020 Learning to simulate complex physics with graph networks Proc. ICML 8459–8468
[12] Shivaditya M V, Alves J, Bugiotti F and Magoulès F 2022 Graph neural network-based surrogate models for finite element analysis Proc. DCABES 54–57
[13] Maurizi M, Gao C and Berto F 2022 Predicting stress, strain and deformation fields in materials and structures with graph neural networks Sci. Rep. 12 21834
[14] Zhao Y, Li H, Zhou H, Attar H R, Pfaff T and Li N 2024 A review of graph neural network applications in mechanics-related domains Artif. Intell. Rev. 57 315
[15] Donon B, Clément R, Donnot B, Marot A, Guyon I and Schoenauer M 2020 Neural networks for power flow: Graph neural solver Electr. Power Syst. Res. 189 106547
[16] Niresi K F, Bissig H, Baumann H and Fink O 2024 Physics-enhanced graph neural networks for soft sensing in industrial internet of things IEEE Internet Things J.
[17] Satorras V G, Hoogeboom E and Welling M 2021 E(n) equivariant graph neural networks Proc. ICML 9323–9332