第19章

RAMS与AI/ML集成

Enabling Dependability in Smart Manufacturing: RAMS and AI/ML Integration

Jing (Janet) Lin¹, Liangwei Zhang²

¹ 瑞典吕勒奥理工大学土木、环境与自然资源工程系
² 瑞典吕勒奥理工大学工业工程系

E-mail: jing.lin@ltu.se

故障预测与健康管理（PHM）主要关注物理退化与失效模式[1]。这些方法侧重于通过结构化的维护计划与统计分析来最大化设备运行时间并降低风险。然而，制造系统的性质正在发生变化。信息物理系统（CPS）、工业物联网（IIoT）以及嵌入式人工智能（AI）的兴起，正将工业环境转变为智能化的互联生态系统[2]。在此背景下，资产不再是无联系的机械部件，而是动态的、软件集成的实体——实时运行、与用户和其他机器交互，并持续适应情境与环境的变化。为应对这一新格局的需求，我们提出以依赖性为中心的资产管理（DCAM）——一个前瞻性框架，对RAMS范式进行扩展与演化[3]。DCAM将传统可靠性工程与系统级依赖性科学及AI保障方法相结合，以应对数字溯源性、信息物理韧性及生命周期适应性等现代挑战。DCAM倡导一种全生命周期导向的依赖性方法，将可靠性思维嵌入从设计到运营、演化与更新的最早阶段。它借助数字技术——包括机器学习、数字孪生及边缘/云架构——来支持预测诊断、自适应维护及情境感知决策。通过将关注点从平均故障间隔时间（MTBF）等静态可靠性指标转向系统韧性及AI模型可信度的动态指标，DCAM使技术性能与透明度、可持续性及运营完整性等更广泛目标保持一致。它使制造商不仅能够应对机械故障，还能应对AI驱动自动化与分布式智能所带来的风险与不确定性。随着制造系统变得越来越复杂和自主化，RAMS必须相应地演进。DCAM在传统可靠性原则与面向未来的依赖性策略之间架起桥梁——将物理、数字与组织维度统一到一个面向智能制造的框架中。在提供基础的同时，表1突出展示了资产管理范式如何从以可靠性为中心及以软件驱动的方法演化至DCAM所体现的集成化、AI赋能的视角，从而应对智能制造中信息物理系统的复杂性及生命周期可持续性。

当前与未来挑战

人工智能（AI）与机器学习（ML）融入制造系统，推动了一场从反应性维护向预测诊断与自主决策的转变[4]。这一转型虽带来显著收益，但也引入了新的复杂性，对可靠性、可用性、可维修性及安全性（RAMS）的传统方法构成挑战[5]。一个关键挑战在于传统可靠性工程与更广泛系统级依赖性之间的割裂。现有的RAMS工具（如故障模式与效应分析（FMEA）及以可靠性为中心的维护（RCM））仍主要聚焦于硬件，往往忽视了现代工业系统所涉及的网络、数字及情境要素。相比之下，来自软件领域的依赖性框架强调容错性、鲁棒性及完整性等属性——但通常缺乏与物理退化模型或生命周期资产管理的整合[6]。这种割裂阻碍了统一策略的发展，难以应对AI赋能制造基础设施的混合性质。第二个挑战源于AI/ML驱动诊断与决策系统中生命周期保障与溯源性的缺失。随着AI模型日益嵌入运营流程，其输出必须具备可解释性、可审计性，并对现实世界的不确定性具有鲁棒性。然而，当前实践往往缺乏在不同部署场景、数据分布或运营情境下评估AI可靠性的机制[7]。这引发了一个双重问题：AI必须为系统依赖性做出贡献，同时AI本身的行为也必须是可靠的。为此，需要持续验证流程、运行时监控、应急机制以及专为安全关键环境中的AI模型量身定制的保障框架。第三，物理组件与数字组件之间日益增长的相互依赖引入了新的脆弱性。边缘计算设备的故障、传感器数据的损坏或网络连接的丧失可能导致系统级联失效，并在更大范围内破坏可用性与安全性[8]。这些信息物理风险要求诊断模型和维护策略具备情境感知能力、自适应性以及动态响应能力——这些都是传统RAMS方法难以有效提供的。组织与人的因素同样构成重大障碍。采用AI驱动的RAMS不仅需要技术，还需要转型——包括 workforce技能提升、运营文化变革以及对数据驱动决策的信任[9]。对自动化的抵制或跨学科协作的缺乏可能导致转型延迟甚至失败，尤其是在遗留系统和实践仍占主导地位的行业中。最后，可持续性目标对RAMS思维提出了变革性压力。当今的制造系统不仅要在技术和经济性能上达标，还须评估其环境影响、资源效率及长期社会价值。这将RAMS的角色从故障规避扩展至生命周期管理——要求方法能够将环境和循环性指标与传统可靠性指标一并纳入考量[10]。这些挑战共同表明，需要新一代依赖性框架——将物理、数字与组织维度统一起来。以依赖性为中心的资产管理（DCAM）方法回应了这一需求，提供了一个将适应性、可解释性和可持续性嵌入下一代制造依赖性核心的整体基础。

应对挑战的科学与技术进展

克服智能制造时代传统RAMS框架的局限性需要新的科学和技术方法——这些方法能够应对信息物理系统、自主运营及数据驱动决策环境的复杂性[11]。以依赖性为中心的资产管理（DCAM）框架通过将生命周期思维、人工智能（AI）与系统级韧性统一为现代制造的凝聚策略，提供了一条前进的路径。

图1展示了DCAM框架的五个基础支柱，它们共同支持资产整个生命周期中的AI驱动依赖性。一个基础性进展在于将非传统AI与机器学习（ML）方法应用于预测诊断、异常检测及剩余使用寿命（RUL）估算。这些技术实现了对资产的持续监控、性能退化的早期检测以及维护调度的数据驱动优化。先进学习技术——如强化学习和联邦学习——促进了分布式工厂系统中的局部适应与去中心化智能，特别是在实时响应性和数据隐私至关重要的场景中[12]。第二个技术支柱是数字孪生的日益广泛应用——即物理资产和流程的虚拟表示。数字孪生支持故障模式仿真、控制策略评估以及在不同运行条件下系统韧性的主动评估[13]。当与实时传感器数据同步时，它们支持预测分析、基于场景的干预规划及长期生命周期优化。第三个关键进展是RAMS、故障预测与健康管理（PHM）及老化管理的融合。每一学科在不同资产生命周期阶段都有独特贡献。RAMS提供群体层面可靠性的统计指标（如MTBF），PHM专注于实时监控和个体化RUL估算，老化管理通过寿命终止决策确保可持续运营。AI/ML技术在整合这些领域中发挥核心作用，实现了动态风险建模、情境感知调度及面向资产的决策支持[14]。这种融合得到了混合AI（如物理信息机器学习）和不确定性感知模型等新兴AI范式的进一步支持，这些范式增强了可解释性和预测鲁棒性[15]。这些方法与可信AI和数字孪生生系统的进展密切相关，强化了系统在层面协调RAMS与AI保障策略的日益增长的需求。为在制造环境中实现安全、透明和可解释的AI，相关进展正在推进AI保障。模型验证、运行时监控及可解释性框架等技术正在获得关注，特别是在安全关键应用中[16]。其他工具——包括故障注入、对抗鲁棒性测试及不确定性量化——正越来越多地用于在运营压力和数据分布变化下验证ML模型。边缘与云计算基础设施的进步也为规模化分布式智能奠定了基础。边缘设备提供低延迟监控和本地化决策，而云平台则支持 fleet级分析、基准测试和优化[17]。两者共同构建了一个灵活架构，用于响应式、全面的RAMS决策支持。情境感知与自适应决策的新兴能力提供了又一次飞跃。这些方法允许根据实时情境变量——如资产关键性、使用强度、环境条件及网络安全态势——来定制维护和安全策略。其结果是能够在不同运营场景下实现更灵活、风险知情型资产管理[18]。最后，AI与可持续性分析的整合引入了多维度的依赖性视角。未来的系统将越来越多地依赖综合性能指标，将环境和社会因素——如能源消耗、碳足迹及材料循环性——与传统可靠性指标一并纳入考量。然而，尽管这些技术极大增强了现代RAMS的能力，它们也引入了一个并行的紧迫需求：确保AI本身的可靠性。当AI嵌入决策系统时，其行为必须在现实条件下保持可信、鲁棒且可解释。AI模型必须持续验证，监控数据漂移和性能退化，并配备应急策略以确保运营可靠性。在这一双重角色中——既是推动者又是可靠性对象——AI需要严格的生命周期保障。其可信度对于技术性能、安全、合规以及用户对未来制造系统的信任都至关重要。

结语

智能制造正在进入一个新阶段——由物理、数字与认知系统的融合来定义。RAMS原则继续作为可靠运营的基础，但它们必须演进以应对由AI驱动自动化、信息物理互联性及可持续性要求所塑造的现代工业环境的复杂性。传统的可靠性工具已不足以确保这些智能、动态生态系统的信任、适应性和长期价值。以依赖性为中心的资产管理（DCAM）框架代表了RAMS思维的一次及时且必要的演进。通过将生命周期意识、系统级依赖性及AI保障嵌入资产管理策略，DCAM为管理日益自主化、数据驱动和软件定义的制造系统提供了一种整体性、前瞻性的方法。本章概述了现有RAMS实践在面临新兴技术和组织挑战时的局限性。还重点介绍了科学和技术进展——从混合AI模型和数字孪生到边缘云智能和情境感知维护——这些进展使得新一代依赖性解决方案成为可能。在这些进展的核心是AI，它扮演着双重角色：既是预测和自适应能力的强大推动者，也是新可靠性与安全问题的来源。管理这种双重性需要强有力的AI溯源、情境感知及以人为本整合的机制。随着制造系统持续扩大复杂性和自主性，DCAM提供了一个战略框架，确保智能工厂不仅具有生产性和高效性，而且在整个生命周期中也是可靠的、透明的和可持续的。它弥合了传统可靠性工程与AI集成工业系统不断发展的需求之间的差距——使制造商能够设计韧性、充满信心地运营并负责任地创新。最终，DCAM为制造依赖性的未来提供了一条实践性和适应性强的路线图——植根于工程严谨性，以AI为丰富手段，并以生命周期管理和系统可信性原则为指导。

致谢

本研究部分得到了中国国家自然科学基金（NSFC）的资助，项目编号为72471060。

参考文献

[1] R. Wang, J. Xu, W. Zhang, J. Gao, Y. Li, and F. Chen, Reliability analysis of complex electromechanical systems: State of the art, challenges, and prospects, vol. 38, no. 7. 2022.

[2] F. Qiu et al., “A Review on Integrating IoT, IIoT, and Industry 4.0: A Pathway to Smart Manufacturing and Digital Transformation,” IET Inf. Secur., vol. 2025, no. 1, p. 9275962, 2025.

[3] J. Lin, “Dependability-Centered Asset Management(DCAM): Toward Trustworthy and Sustainable Systems in the CPS Era,” IEEE Reliab. Mag., vol. online, pp. 1–7, 2025.

[4] R. Siraskar, S. Kumar, S. Patil, A. Bongale, and K. Kotecha, Reinforcement learning for predictive maintenance: a systematic technical review, vol. 56, no. 11. Springer Netherlands, 2023.

[5] H. A. Fernandez-Bobadilla and U. Martin, “Modern Tendencies in Vehicle-Based Condition Monitoring of the Railway Track,” IEEE Trans. Instrum. Meas., vol. 72, pp. 1–44, 2023.

[6] S. M. Hoseyni, F. Di Maio, and E. Zio, “Condition-based probabilistic safety assessment for maintenance decision making regarding a nuclear power plant steam generator undergoing multiple degradation mechanisms,” Reliab. Eng. Syst. Saf., vol. 191, p. 106583, 2019. Journal XX (XXXX) XXXXXX A Author et al 90

[8] A. H. Eyeleko and T. Feng, “A Critical Overview of Industrial Internet of Things Security and Privacy Issues Using a Layer-Based Hacking Scenario,” IEEE Internet Things J., vol. 10, no. 24, pp. 21917–21941, 2023.

[9] M. A. Muhammed Nor et al., “Role of Human Factor for the Implementation of the ‘Vision Zero’ Concept in Railway Transport: An Overview”,” in AIP Conference Proceedings, 2024, vol. 2998, no. 1, p. 030005.

[10] G. W. Vogl, B. A. Weiss, and M. Helu, “A review of diagnostic and prognostic capabilities and best practices for manufacturing,” J. Intell. Manuf., vol. 30, no. 1, pp. 79–95, 2019.

[11] J. Majumdar, R. S. Mohril, B. K. Lad, and M. S. Kulkarni, “Logistics, Reliability, Availability, Maintainability and Safety (L- RAMS) for Intelligent, Interconnected, Digital and Distributed (I2D2) Empowered Futuristic Military Systems,” IEEE Trans. Eng. Manag., vol. 71, pp. 5869–5884, 2024.

[12] F. Su, C. Liu, and H. G. Stratigopoulos, “Testability and Dependability of AI Hardware: Survey, Trends, Challenges, and Perspectives,” IEEE Des. Test, vol. 40, no. 2, pp. 8–58, 2023.

[13] E. Brusa, “Digital Twin: Toward the Integration Between System Design and RAMS Assessment Through the Model-Based Systems Engineering,” IEEE Syst. J., vol. 15, no. 3, pp. 3549–3560, 2021.

[14] M. Payette and G. Abdul-Nour, “Machine Learning Applications for Reliability Engineering: A Review,” Sustainability, vol. 15, no. 7, pp. 1–22, 2023.

[15] I. Hazra et al., “Prognostics and Health Management of Unmanned Surface Vessels: Past, Present, and Future,” J. Comput. Inf. Sci. Eng., vol. 24, no. 8, p. 080801, 2024.

[16] J. Perez-Cerrolaza et al., “Artificial Intelligence for Safety-Critical Systems in Industrial and Transportation Domains: A Survey,” ACM Comput. Surv., vol. 56, no. 7, pp. 1–40, 2024.

[17] M. Molęda, B. Małysiak-Mrozek, W. Ding, V. Sunderam, and D. Mrozek, “From Corrective to Predictive Maintenance—A Review of Maintenance Approaches for the Power Industry,” Sensors, vol. 23, no. 13, p. 5970, 2023.

[18] M. Rodríguez-Hernández, A. Crespo-Márquez, A. Sánchez-Herguedas, and V. González-Prida, “Digitalization as an Enabler in Railway Maintenance: A Review from ‘The International Union of Railways Asset Management Framework’ Perspective,” Infrastructures, vol. 10, no. 4, p. 96, 2025.