第14章

基于归纳偏置的物理信息机器学习

Physics Informed Machine Learning through Inductive Bias

Olga Fink¹, Vinay Sharma¹

¹ 洛桑联邦理工学院（EPFL）智能维护与运营系统，瑞士洛桑

E-mail: olga.fink@epfl.ch

现状

在智能制造中，物理信息机器学习（PIML）[1]正成为构建数据高效、物理一致、可解释且可信的人工智能系统的关键推动者。制造环境的特点是流程复杂、系统相互关联，且通常存在稀疏或噪声传感器数据[2]。PIML通过将领域知识——如控制方程、结构约束或物理对称性——直接嵌入学习过程来解决这些挑战。

PIML引入三类偏置以引导模型获得可泛化且物理合理的解：归纳偏置、观测偏置和学习偏置。归纳偏置是嵌入于模型架构中的先验假设——如空间局部性[3]、守恒定律[4]或时间连续性[5]——它们约束了解空间。观测偏置源于数据的采样或表示方式，而学习偏置则产生于优化策略，如正则化或特定损失函数。

在智能制造中，由于物理过程的复杂性和多样的传感器配置，归纳偏置发挥着尤为重要的作用。关于传感器位置（关系性）、时间动态和信号特性的知识可被有效地整合为归纳偏置，以增强模型的泛化能力、可解释性和数据效率[6]。它使得模型能够在有限数据下学习，同时确保预测结果符合已知的物理和操作约束。例如，嵌入热动力学、材料行为、磨损过程或守恒定律知识的模型，更适用于预测性维护、质量保证和控制[7][8]。归纳偏置同样增强了可解释性——这对操作人员信任和安全关键场景的部署至关重要。

归纳偏置的一个重要子类是结构偏置和关系偏置[3]，它们在建模现代制造系统时日益重要，因为传感器测量往往表现出强烈的空间和时间相关性。结构偏置编码了关于系统层级化或模块化组织的假设，而关系偏置则捕捉组件之间的相互作用和相互依赖关系。图神经网络（GNN）天然能够利用这些偏置，并在智能制造中展现出强大的潜力。

GNN能够将机器、传感器和子系统建模为图中的节点，以边表示它们之间的物理、功能或空间关系。这使其非常适用于故障传播分析、根因诊断和系统级健康监测等任务。时空图神经网络[10]进一步融入了时间动态，使得跨分布式系统演变传感器数据的实时分析成为可能。

在智能制造中，GNN正越来越多地用作代理模型，以逼近复杂动力系统的行为——在这些系统中，直接仿真（如有限元或多物理场模型）计算成本极高[11][12][13]。通过从系统级传感器数据和已知组件相互作用中学习，GNN能够以高保真度模拟物理过程，从而实现快速、可扩展的诊断、控制和优化。

随着智能制造向互联的赛博物理环境演进，融合结构偏置和关系偏置——特别是通过基于GNN的PIML模型——将成为构建稳健、可扩展、透明的人工智能驱动决策系统的核心。

当前及未来挑战

代理建模是智能制造的关键推动者，为复杂的物理和赛博物理系统提供高效近似。这些模型对于实时应用至关重要——如系统诊断、控制和预测性维护——因为在这些场景中，完整规模的仿真（如有限元或多物理场模型）计算代价过于高昂。尽管前景广阔，代理模型仍面临若干与制造环境相关的开放性挑战。

一个主要需求是：在不断变化的操作条件下实现快速的在线动力学预测。模型必须在系统负载、速度或热状态发生变化时仍能提供可靠、实时的输出。此外，它们还须支持长轨迹滚动展开——即将模型输出反馈作为输入，迭代预测系统在未来长时间跨度内的状态——同时最小化误差累积，以确保预测在时间维度上的稳定性。

学习动态的可解释性和可说明性仍然至关重要。许多高性能模型表现为黑箱，使得验证或解释其输出变得困难——这在安全关键的制造环境中是不可接受的局限性。代理模型不仅需要准确，还须透明且具有物理意义。

工业系统天生具有噪声且数据丰富。模型必须处理噪声、异构的传感器输入，这些输入往往具有不同的采样率和分辨率。它们还须能够直接从观测轨迹中学习，即使在系统参数或控制方程未知的情况下，这要求强大的归纳偏置和关系偏置。

除鲁棒性和表达力之外，可扩展性同样必不可少。制造过程日益涉及多物理场相互作用（如热-机械耦合）和多保真度数据流——从高分辨率仿真到低质量实时传感器。代理模型必须连贯地整合这些信息，并在空间和时间分辨率上实现规模化。

最具挑战性的问题之一是泛化能力和外推能力。人们不仅期望代理模型在训练数据域内泛化，还期望它们能够外推到全新的系统配置和操作条件而无需重新训练。这在柔性或模块化制造场景中尤为重要，因为系统布局和用例不断演变。许多当前模型缺乏处理此类部署场景的适应性，尤其是在故障数据稀疏或不断演变的情况下[14]。

此外，逆参数推断——如从观测数据中识别过程条件、材料属性或系统级参数——以及退化、磨损或其他长期系统演化的显式建模，仍是重大挑战。这些局限性限制了代理模型在智能制造中的更广泛应用，而准确、可解释和动态的模型对于过程优化、自适应控制、质量保证和生命周期管理至关重要。

应对挑战的科学技术进展

物理信息图神经网络（PI-GNN）为解决上述挑战提供了一条有前景的路径。最近的发展将几何和物理归纳偏置集成到传统GNN中——从领域特定的物理先验（如基尔霍夫定律[15]或热通量连续性[16]）到更广泛的原则，如对称性[17]、热力学定律[18]和动量守恒[4]——从而将传统GNN扩展为PI-GNN。这些物理归纳偏置增强了GNN固有的关系偏置，使得对组件间相互作用的建模既有物理基础又计算高效，带来了以下关键能力：

数据效率与长轨迹预测：物理感知的归纳偏置约束了假设空间，使模型能够从稀疏、噪声数据中准确学习，并防止长期预测中出现非物理的漂移。
泛化能力与外推能力：模块化相互作用学习和嵌入的物理知识增强了对未见拓扑、边界和操作制度的迁移能力。
可解释性与可说明性：物理定律指导消息传递机制，使成对相互作用能够表示有意义的内部变量（如应力或热通量），从而支持安全关键系统的透明度。

为充分实现PI-GNN作为生产级工具的潜力，研究须在以下三个关键领域取得进展：

1. 跨领域应用与通用物理信息先验：虽然某些近期的PI-GNN——如热力学一致性网络[18]和动量保持等变图网络[4]——显示出跨领域潜力，但大多数仍受限于领域特定的归纳偏置。要适用于耦合热-机械、机电和流-固系统，未来的架构必须将通用物理定律——能量、动量、质量和电荷守恒——直接嵌入其消息传递机制。

2. 虚拟传感：估计不可观测变量——如金属增材制造中的残余应力或高粘度混合器中的内部剪切力——对过程监测至关重要。由于这些量无法直接测量，具有强物理先验的PI-GNN能够从异构、多保真度数据中推断这些内部变量。其学习到的成对消息隐含地表示接触负载等量[5]。在物理定律（如动量守恒）的指导下，这些消息可被解码为来自可观测动态的可解释变量，支持自适应控制和缺陷预防。

3. 社区基准测试：推进智能制造中的PI-GNN研究需要基准数据集，这些数据集结合高保真仿真与跨不同操作条件的真实传感器数据。这些数据集应捕捉领域偏移、传感器噪声和过程变异性，以实现对泛化能力和鲁棒性的严格评估。来自专用试验台的内部状态测量——如接触负载——对推动虚拟传感尤为重要。

当这些关键进展被整合时，将为稳健、可解释、可扩展的PI-GNN模型奠定基础，使其作为跨多种系统类型的可靠数字代理模型发挥作用，以支持下一代智能制造环境中的更智能、更可持续的系统设计、实时监测和自适应控制。

结论

物理信息机器学习正成为构建数据高效、可解释且符合物理原理的人工智能系统的关键推动者——这是在具有复杂动态、稀疏传感和安全关键约束的智能制造环境中的必备要求。

虽然图神经网络本身并非物理信息驱动，但其为表示制造系统的结构化、关系性质提供了天然框架。当通过额外的广义基于物理的归纳偏置——如守恒定律、对称性或能量一致性——进行扩展时，GNN可以作为跨多物理场、多尺度环境有效的代理模型和推理引擎。

这些物理信息图神经网络在故障传播分析、虚拟传感、长时域控制和自适应监测等任务上展现出强大潜力。它们还提供了可微分、结构化的模型，可集成到现代控制架构中。

要充分实现这一潜力，还需要在泛化、外推、动态图适应和从仿真到现实的迁移等领域开展进一步研究。开发将仿真与传感器数据相结合的标准化基准测试至关重要。

随着智能制造向自主化、赛博物理系统演进，PI-GNN等物理引导学习框架将在构建稳健、可信的人工智能解决方案中发挥日益重要的作用。

致谢

本工作得到了瑞士国家科学基金会（SNSF）资助200021_200461的支持。

参考文献

[1] Karniadakis G E, Kevrekidis I G, Lu L, Perdikaris P, Wang S and Yang L 2021 Physics-informed machine learning Nat. Rev. Phys. 3 422–440 (doi: 10.1038/s42254-021-00314-5) Journal XX (XXXX) XXXXXX A Author et al 65

[2] Phuyal S, Bista D and Bista R 2020 Challenges, opportunities and future directions of smart manufacturing: A state-of-the-art review Sustain. Prod. Consump. 23 287–302 (doi: 10.1016/j.spc.2020.06.002)

[3] Battaglia P W, Hamrick J B, Bapst V, Sanchez-Gonzalez A, Zambaldi V, Malinowski M, Tacchetti A, Raposo D, Santoro A, Faulkner R et al 2018 Relational inductive biases, deep learning, and graph networks arXiv:1806.01261

[4] Sharma V and Fink O 2025 Dynami-CAL GraphNet: A physics-informed graph neural network conserving linear and angular momentum for dynamical systems arXiv:2501.07373

[5] Sharma V, Oddon R T, Tesini P, Ravesloot J, Taal C and Fink O 2025 Equi-Euler GraphNet: An equivariant, temporal- dynamics informed graph neural network for dual force and trajectory prediction in multi-body systems arXiv:2504.13768

[6] Zhu G, Wang S and Wang L 2024 Heterogeneous graph neural network for modeling intelligent manufacturing systems Meas. Sci. Technol. 36 015114

[7] Peng J-Z, Hua Y, Li Y-B, Chen Z-H, Wu W-T and Aubry N 2023 Physics-informed graph convolutional neural network for modeling fluid flow and heat convection Phys. Fluids 35 085104

[8] Xue T, Gan Z, Liao S and Cao J 2022 Physics-embedded graph network for accelerating phase-field simulation of microstructure evolution in additive manufacturing npj Comput. Mater. 8 201

[9] Zhao M, Taal C, Baggerohr S and Fink O 2025 Graph neural networks for virtual sensing in complex systems: Addressing heterogeneous temporal dynamics Mech. Syst. Signal Process. 230 112544

[10] Yu B, Yin H and Zhu Z 2018 Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting Proc. IJCAI 3634–3640

[11] Sanchez-Gonzalez A, Godwin J, Pfaff T, Ying R, Leskovec J and Battaglia P 2020 Learning to simulate complex physics with graph networks Proc. ICML 8459–8468

[12] Shivaditya M V, Alves J, Bugiotti F and Magoulès F 2022 Graph neural network-based surrogate models for finite element analysis Proc. DCABES 54–57

[13] Maurizi M, Gao C and Berto F 2022 Predicting stress, strain and deformation fields in materials and structures with graph neural networks Sci. Rep. 12 21834

[14] Zhao Y, Li H, Zhou H, Attar H R, Pfaff T and Li N 2024 A review of graph neural network applications in mechanics-related domains Artif. Intell. Rev. 57 315

[15] Donon B, Clément R, Donnot B, Marot A, Guyon I and Schoenauer M 2020 Neural networks for power flow: Graph neural solver Electr. Power Syst. Res. 189 106547

[16] Niresi K F, Bissig H, Baumann H and Fink O 2024 Physics-enhanced graph neural networks for soft sensing in industrial internet of things IEEE Internet Things J.

[17] Satorras V G, Hoogeboom E and Welling M 2021 E(n) equivariant graph neural networks Proc. ICML 9323–9332