当前位置: 首页 > news >正文

POF | 西北工业大学宋家豪、张伟伟等:一种基于伴随方法的物理信息神经网络预处理框架

一种基于伴随方法的物理信息神经网络预处理框架

A matrix preconditioning framework for physics-informed neural networks based on the adjoint method

宋家豪,曹文博,张伟伟*

引用格式:
J. Song, W. Cao, W. Zhang, A matrix preconditioning framework for physics-informed neural networks based on the adjoint method, Physics of Fluids, 37 (2025).

编者按

----------

物理信息神经网络(PINNs)在正问题中的病态仍是限制其迈入复杂工程问题的一大局限。该工作设计了一种针对损失函数的预处理框架,通过降低PDE系统的条件数实现了对PINNs病态的缓解,在目前PINNs相对棘手的问题中取得了好的表现。

一、研究背景

物理信息神经网络(Physics-informed neural networks, PINNs)近年来日益受到偏微分方程(Partial differential equations, PDEs)求解领域的关注。自其提出以来,学者们发展了大量改进方法提升PINNs的表现,使其在流体力学、热传导和电磁学等领域得到了广泛应用。然而,受限于PDE损失函数的病态,PINNs在某些问题上难以获得令人满意的结果[1-3]。

在之前的研究[1]中,我们验证了PINNs的病态与PDE的Jacobian矩阵的紧密联系。具体地, PINNs的收敛随着Jacobian矩阵的条件数增加而变得困难甚至得到错误的结果。因此,本文提出了一种基于伴随方法的PINNs预处理框架,通过降低Jacobian矩阵的条件数来缓解PINNs的病态。

二、研究方法

考虑定义在的定常PDE,

其中表示PDE的解,表示通用微分算子,表示边界条件算子。对上式进行有限差分离散,被一个离散系统代替(表示神经网络预测解)。对于线性PDE,为线性系统。

其中A为Jacobian矩阵J

对于非线性PDE,在经过适当线化后,它也可以表示为线性系统。基于此,PINNs的PDE损失变为

在之前的研究[1]中,我们验证了PINNs的病态与Jacobian矩阵的联系,具体地,PINNs的收敛随着J条件数的增加而变得困难甚至得到错误的结果。因此,本文对PDE离散得到的线性系统做左预处理,假设预处理子为M,线性系统变为

上式表示的线性系统的Jacobian矩阵为,根据预处理理论,表示矩阵的条件数)。因此,基于预处理后的线性系统构建损失函数可以改善PINNs的收敛性和精度。修正后的损失函数为

一个关键问题是获取预处理子M,它通常通过对J进行因子分解得到,例如本文使用的不完全LU分解。因此,我们首先结合自动微分和矩阵染色计算J。对于小规模问题,直接计算是可接受的。然而,对于大规模问题,计算需要极大的计算和存储成本。因此,在实际中,通常被求解替代。例如,本文基于不完全LU分解转化为依次求解。凭借L和U的三角属性,两个线性方程组通过一次代入便可完成求解,成本很低。然而,因为代入过程不支持自动微分,得到的被从计算图中分离(表示变量从计算图中分离),这导致无法计算损失函数关于网络参数的梯度,梯度下降无法进行。本文通过引入伴随方法来解决这个问题。

考虑约束优化问题

为将上式转化为无约束优化问题,建立拉格朗日函数

其中λ为拉格朗日乘子,它的必要最优性条件为

其中自然满足,因为是通过求解得到。容易通过得到。因此,可以获得关于的偏导数。因为没有显式计算,本文使用计算的方法类似地计算。之后,建立新的损失函数,

该损失的数值与其关于网络参数的梯度与原始损失完全相同,并且它更加普适。因此,本文使用它作为预处理方法的损失函数。

三、结果与分析

A.二维Poisson方程

本文首先通过求解二维Poisson方程来验证所提方法的有效性,这个方程被广泛作为PINNs相关研究中的数值实验。

其中源项,解析解为。我们设置k=15,根据Basir and Senocak的研究[4],PINNs在这个条件下失效。

图1展示了使用PINNs和所提方法求解此问题的收敛历程。可以观察到尽管两种方法的损失下降了相同数量级,但预处理方法的误差比PINNs低一个数量级以上。类似的现象可以在[1, 2]中观察到,根据现有研究,由于PDE损失的病态,PINNs损失的下降并不意味着解精度的提升,它可能陷入错误的局部最优。

图1 求解Poisson方程的收敛历程

B.Navier-Stokes equations

本文进一步在Navier-Stokes方程上进行了测试,考虑顶盖驱动方腔流动。我们分别在雷诺数400和3200的条件下进行了流场求解,图3与图4分别展示了两种状态下PINNs与预处理方法的收敛历程。可以观察到,当Re=400时,PINNs经过1000个epoch误差降至5%,而引入预处理后仅需50个epoch便可将误差降至1%。而当Re=3200时,PINNs的误差始终维持在100%附近,尽管它的损失在不断下降。而引入预处理后可以将误差降至3%,图4展示了两种方法获得的速度幅值。

图2 求解雷诺数400条件下的顶盖驱动方腔流动的收敛历程
图3 求解雷诺数3200条件下的顶盖驱动方腔流动的收敛历程
图4 求解雷诺数3200条件下的顶盖驱动方腔流动获得的速度幅值

结论

本文提出了一种预处理方法以缓解PINNs的病态并提升其收敛性。结合矩阵染色和自动微分,我们首先设计了一种高效方法来计算Jacobian矩阵。之后,预处理子通过对Jacobian矩阵进行不完全LU分解获得。为了以低成本实现预处理,关于预处理子的解析求逆被基于不完全LU分解的三角求解代替,同时伴随方法被引入以解决网络参数梯度缺失的问题。通过求解多尺度和高雷诺数问题,验证了所提方法的有效性。

参考文献

[1] W. Cao, W. Zhang, An analysis and solution of ill-conditioning in physics-informed neural networks, Journal of Computational Physics, 520 (2025) 113494.

JCP|西工大曹文博、张伟伟:物理信息神经网络的病态分析与病态解决方案

[2] P. Rathore, W. Lei, Z. Frangella, L. Lu, M. Udell, Challenges in training PINNs: A loss landscape perspective, arXiv preprint arXiv:2402.01868, (2024).

[3] A. Krishnapriyan, A. Gholami, S. Zhe, R. Kirby, M.W. Mahoney, Characterizing possible failure modes in physics-informed neural networks, Advances in Neural Information Processing Systems, 34 (2021) 26548-26560.

[4] S. Basir, I. Senocak, Critical investigation of failure modes in physics-informed neural networks, in:AIAA SCITECH 2022 Forum, 2022, pp. 2353.

公众号原文链接(文末附论文资源):

POF | 西北工业大学宋家豪、张伟伟等:一种基于伴随方法的物理信息神经网络预处理框架

注:文章由作者原创供稿,并获得作者授权发布。

http://www.cnnetsun.cn/news/21229.html

相关文章:

  • 审计场景中录音转文字工具的技术实现与选型指南
  • Livewire完整入门指南:5分钟掌握Laravel动态界面开发
  • Origami Simulator实战指南:从零开始掌握数字折纸艺术
  • 波浪带鱼理论:过滤无效信号,提升投资收益的法宝
  • Step1X-Edit v1.2发布:推理编辑能力跃升,重新定义AI图像创作标准
  • BlenderMCP像素艺术转换终极指南:从3D模型到复古游戏资产的快速上手
  • OpenMower机器人割草机固件测试实战指南
  • 23、深入解析Kubernetes集群扩展与高级网络
  • Many Notes:打造高效云端笔记的终极解决方案
  • 【网络安全】渗透测试零基础入门之什么是文件包含漏洞?一文带你讲清其中的原理!
  • TypeScript:现代前端开发的类型约束者
  • 专业字体文件转换完全指南:ttctools使用详解
  • Descript Audio Codec:终极音频压缩解决方案,90倍压缩率重塑音质体验
  • 利用 DeepSeek 提升工作效率
  • Webhook.site终极选择指南:自部署与云端方案深度解析
  • PHPBrew自定义任务终极指南:扩展开发与实战技巧
  • 如何优雅重构HP-Socket应用:Deno 2.0兼容性深度解析与迁移策略
  • 老旧Mac升级终极指南:完整教程解锁macOS兼容新世界
  • 联想显卡散热风扇更换教程查找全攻略:从官方指引到社区经验
  • springboot基于vue的管网隐患安全巡检系统_i2g600ga
  • next-scene LoRA实战指南:3步实现电影级分镜AI生成
  • 传统算法之Canny亚像素边缘检测及将离散边缘点链接成线条的优化和探讨。
  • Autoware卡尔曼滤波技术:让自动驾驶感知系统更精准可靠
  • 优化算法matlab实现(一)相关matlab基础
  • 降本增效利器!腾讯云云服务器成本优势全解析
  • 如何5分钟搭建跨平台窗口监控系统:终极工具完全指南
  • NotchDrop:让MacBook刘海变身智能文件中转站
  • 5亿参数改写边缘智能规则:腾讯Hunyuan-0.5B-Instruct轻量化模型深度解析
  • 如何快速解决Nacos数据库升级冲突:5个实用技巧
  • 高密度互连板层压创新:从任意层互连到微孔填充技术