当前位置: 首页 > news >正文

AgentsCAD:基于多智能体大模型推理与几何特征识别的FDM增材制造自动化设计

AgentsCAD:基于多智能体大模型推理与几何特征识别的FDM增材制造自动化设计

原文arXiv链接:https://arxiv.org/html/2607.02448v1

摘要

熔融沉积成型(FDM)3D打印零件通常需要面向制造的设计(DFAM)几何修改,保证可打印性、结构强度并减少后处理工序。现有切片软件仅能识别悬空等缺陷,但无法自动修改底层B-Rep边界表示几何。
本文提出AgentsCAD多智能体系统,打通B-Rep几何与大语言模型(LLM)推理链路,实现DFAM自动化优化。整体工作流:解析STEP标准几何文件→图神经网络识别几何特征→Claude Sonnet设计推理智能体生成几何修改方案→GPT-4o多模态视觉校验器验证几何有效性。系统输出优化后STEP文件与可读制造分析报告。
以鸟屋CAD模型为完整测试案例,系统可自动识别45°以上悬空缺陷,选择合理几何修正策略并输出物理可行修改方案,解决“三维几何转自然语言”这一大模型CAD改造核心难题。
关键词:面向增材制造设计DFAM、FDM熔融沉积、大语言模型LLM、多智能体流水线、B-Rep边界表示、STEP文件、GraphSAGE图神经网络
缩写:FDM/DFAM/LLM/VLM/B-Rep/STEP

1 引言

1.1 研究背景

FDM逐层堆积材料制造三维零件,向下倾斜超过45°的曲面属于典型悬空结构,若无支撑会打印失效。DFAM设计规范通过修改几何消除悬空、提升尺寸精度与力学性能、减少支撑与后处理。
现有切片工具仅标记缺陷区域,工程师需在CAD与切片软件间反复手动迭代,流程低效。近年LLM/VLM开始介入CAD领域,但现有工具仅能从文生CAD、完成缺陷预测,不存在读取现有STEP模型并自动修改B-Rep几何的闭环DFAM系统。

1.2 相关研究现状

  1. 文生CAD类模型:Text2CAD、Query2CAD、CADSmith仅支持根据文本生成全新模型,无法编辑已有零件;
  2. 几何自动特征识别AFR:传统规则+浅层网络、3D CNN、UV-Net、Hierarchical CADNet基于B-Rep面邻接图提取加工特征,但仅分类不输出修改方案;
  3. 图神经网络基础:GCN为直推式图分类,无法泛化全新CAD图;GraphSAGE为归纳式学习,适配未见过的STEP零件;
  4. 制造缺陷预测模型:LLM3D打印、Alloy智能体仅监控打印过程,不前置优化CAD几何。

现有工作均为孤立子模块,缺少完整闭环:读取STEP→识别制造缺陷→LLM推理修改→几何生成→视觉校验。本文核心问题:能否构建多智能体LLM系统全自动完成FDM零件DFAM改造?

1.3 论文核心贡献

  1. 提出AgentsCAD黑板架构多智能体流水线,完整实现STEP几何解析、图特征提取、LLM DFAM推理、CAD自动修改、多模态视觉校验闭环;
  2. 基于MFC++数据集训练GraphSAGE归纳式几何特征分类器,对比GCN证明其泛化优势,支持全新零件自动识别25类加工特征;
  3. 设计几何结构化JSON序列化方案,将B-Rep拓扑、曲面特征压缩至LLM上下文窗口,解决三维几何向文本转化难题;
  4. 引入MCP几何工具约束LLM推理,消除3D坐标幻觉,搭配GPT-4o视觉校验保证修改物理有效性;
  5. 以鸟屋模型完成完整端到端验证,输出可直接用于3D打印的优化STEP文件与标准化制造报告。

图1 AgentsCAD多智能体整体流水线

输入STEP三维CAD模型

几何解析智能体
B-Rep拓扑提取、悬空检测、GraphSAGE特征标注

共享黑板全局状态存储

Claude Sonnet 4.6
设计推理智能体
CoT链式推理+MCP几何工具

几何修改模块 CadQuery执行倒圆角/泪滴/旋转等操作

GPT-4o视觉校验智能体
多视图渲染验证几何完整性

校验通过?

输出优化STEP+DFAM修改报告

流程说明:原始CAD(a)输入推理智能体(b)生成几何调整方案,执行CAD代码修改©,VLM校验迭代后输出可打印验证模型(d)。

2 相关工作

  1. LLM3D打印智能体:基于相机层内缺陷实时调整打印参数,仅针对成型过程,不前置优化CAD几何;
  2. 合金设计多智能体:依托MCP协议调用ThermoCalc材料工具,用于增材合金工艺图生成,无几何编辑能力;
  3. RocketSmith火箭设计系统:整合OpenRocket、CADSmith生成火箭STEP,无FDM悬空DFAM优化模块;
  4. 各类文生CAD、特征识别网络均无法实现“读取已有零件并自动消除打印缺陷”的完整闭环。

3 理论基础

3.1 GCN图卷积网络(直推式)

以面为节点、邻接面为边构建B-Rep二部图,层更新公式:
H(l+1)=σ ⁣(D~−1/2A~D~−1/2H(l)W(l))\mathbf{H}^{(l+1)}=\sigma\!\left(\tilde{\mathbf{D}}^{-1/2}\tilde{\mathbf{A}}\tilde{\mathbf{D}}^{-1/2}\mathbf{H}^{(l)}\mathbf{W}^{(l)}\right)H(l+1)=σ(D~1/2A~D~1/2H(l)W(l))
A~\tilde{A}A~为自环邻接矩阵,D~\tilde{D}D~度矩阵,缺点:仅能在训练图上推理,无法处理全新CAD模型。

3.2 GraphSAGE归纳图网络(本文核心特征提取器)

邻域特征拼接聚合,保留节点自身几何属性,支持未见过的零件推理:
hv(l+1)=σ ⁣(W(l)⋅CONCAT ⁣(hv(l), MEANu∈N(v)hu(l)))h_{v}^{(l+1)}=\sigma\!\left(W^{(l)}\cdot\mathrm{CONCAT}\!\left(h_{v}^{(l)},\;\mathrm{MEAN}_{u\in\mathcal{N}(v)}h_{u}^{(l)}\right)\right)hv(l+1)=σ(W(l)CONCAT(hv(l),MEANuN(v)hu(l)))
优势:独立学习聚合函数而非固定图嵌入,少量新零件即可泛化。

3.3 RAG检索增强生成

解决LLM无长期零件记忆问题:每完成一个零件分析,将几何特征、修改方案向量化存入FAISS向量库;新零件推理时检索相似历史DFAM案例,提供领域先验知识,持续提升系统随数据累积的推理精度。

4 方法:AgentsCAD完整系统实现

4.1 CAD几何文本表征方案(核心前置模块)

原始STEP二进制B-Rep无法直接输入LLM,本文设计结构化JSON表征,包含三大模块:

  1. 单曲面特征:曲面类型(平面/圆柱/圆锥/B样条)、面积、质心、法向量倾斜角、回转半径、伸长系数;
  2. 拓扑邻接关系:面ID共享边邻接图,记录孔洞、台阶等拓扑关联;
  3. GraphSAGE语义标签:25类加工特征(口袋/通孔/倒角等)+置信度。
    数据来源:基于OpenCASCADE内核、CadQuery遍历B-Rep,UV网格采样曲面曲率补充特征,最终压缩JSON可完整放入LLM上下文窗口,同时保留三维空间关系,避免纯浮点数组无拓扑信息的缺陷。

4.2 黑板模式多智能体全局架构

摒弃LangChain/CrewAI消息传递架构,采用经典黑板共享状态设计:

  • 全局唯一黑板存储所有几何数据、缺陷标记、特征标签、修改方案、渲染图;
  • 各智能体独立读写黑板,模块完全解耦,可单独替换LLM、GNN、几何引擎;
    三大核心特性:
  1. 确定性前置规则检测:无需LLM,通过面法向量与Z轴夹角直接标记>45°悬空,提供可验证真值;
  2. 条件分支执行:无悬空缺陷时自动跳过推理、修改、校验阶段,节省API开销;
  3. 双模型解耦:推理端Claude Sonnet,视觉校验端GPT-4o,任意模型可独立替换。

4.3 系统九阶段完整执行流水线

  1. STEP解析:CadQuery+OCCT读取模型,提取所有曲面几何参数、包围盒、质心;
  2. 规则悬空检测:计算面法向量与打印Z轴夹角,θ≤0标记为悬空缺陷;
  3. 拓扑图构建:遍历共享边生成面邻接关系图存入黑板;
  4. GraphSAGE特征推理:输入B-Rep二部图,输出25类加工语义标签;无预训练权重则降级Node2vec;
  5. RAG案例检索:当前几何向量匹配历史DFAM案例,追加至LLM提示词;
  6. 设计推理智能体(Claude Sonnet):CoT链式推理,调用2个MCP几何工具:
    • check_orientation_overhangs:评估各旋转方案悬空数量;
    • lay_face_to_build_surface:计算最优平铺欧拉旋转角;
      推理优先级:全局旋转→局部圆角/泪滴修改→支撑方案→零件拆分;
  7. 几何修改执行:CadQuery按面ID批量执行修改,旋转操作最后执行(旋转会改变面索引);
  8. VLM视觉校验(GPT-4o):四视图2048×2048渲染,针对每处修改生成Yes/No校验问题,识别几何失效;
  9. 输出归档:优化STEP、2×2渲染图、DFAM修改报告、完整黑板快照。

4.4 GraphSAGE与GCN消融实验设计

对比三组特征输入:

  1. 仅基础5维曲面特征;
  2. 基础特征+层级面邻接聚合;
  3. 基础特征+UV网格曲率增强特征;
    网络均3层卷积,隐藏维度64,Dropout=0.5,评价指标宏F1(平衡稀有加工特征分类精度)。
表1 MFCAD++测试集分类性能对比
网络架构特征配置准确率宏F1宏精确率宏召回
GCN(基线)仅基础特征0.4430.3380.3360.396
GCN层级聚合0.3630.3060.3450.377
GCNUV增强特征0.5380.4690.4720.552
GraphSAGE仅基础特征0.6380.5450.5340.579
GraphSAGE层级聚合0.7940.7270.7160.753
GraphSAGEUV增强特征0.8500.7850.7740.805
结论:GraphSAGE归纳式拼接聚合显著优于GCN归一化加权,UV曲率特征进一步提升稀有特征识别精度。

图2 MeshViz可视化特征分类结果

  • 左:原始零件三维模型;
  • 右:GraphSAGE+UV预测着色模型,红色为错分面;
    错分集中于加工特征与基体边界,边界混合邻域导致表征模糊,为后续优化方向。

4.5 MCP几何工具消融关键结论

无MCP工具约束时,LLM频繁幻觉错误旋转角度;引入check_orientation_overhangslay_face_to_build_surface后,所有坐标变换计算完全基于真实几何,消除推理幻觉,是系统必备组件而非优化项。

4.6 视觉校验模块

复用CADCodeVerify校验范式,修改后模型生成四张正交视图,针对每一处几何修改生成定向校验提问,GPT-4o输出判定与推理,检测圆角缺失、旋转失效、干涉等隐性几何错误,自动化替代人工肉眼审核。

5 端到端鸟屋模型完整实验

图3 鸟屋模型前后对比

  • 原始模型:两个90°水平圆柱通孔,严重悬空,无法无支撑打印;
  • 系统优化流程:
    1 RAG检索水平通孔DFAM历史案例;
    2 推理智能体评估6组旋转方案,选择X轴90°平铺,消除一个通孔悬空;
    3 剩余通孔自动生成泪滴轮廓修改;
    4 VLM校验几何完整性,体积仅减少0.75%;
    5 输出无悬空可直接打印STEP文件。
    完整链路仅一轮迭代完成全部DFAM优化,无人工干预。

6 实验结论

  1. B-Rep拓扑+结构化JSON表征可完整向LLM传递三维制造信息,仅浮点数组会丢失空间关联,推理失效;
  2. GraphSAGE归纳图网络在全新CAD零件特征识别上全面超越直推式GCN,UV曲率特征进一步提升稀有加工特征识别;
  3. MCP几何工具是消除LLM三维坐标幻觉的必要条件,无工具约束会输出大量不可行几何修改;
  4. AgentsCAD实现从原始STEP到可打印优化模型全自动闭环,输出几何文件、标准化DFAM制造报告,填补现有CAD+LLM工具空白。

7 未来工作方向

  1. 支持多装配体、复杂大模型子图压缩,缓解LLM上下文窗口限制;
  2. 拆分多专用推理子智能体(应力、薄壁、桥接缺陷专项模块);
  3. 扩展缺陷检测种类:薄壁、桥接、内支撑、自相交;
  4. 完善RAG向量库,累积海量零件DFAM案例持续提升推理;
  5. 适配下一代多模态原生LLM,抛弃JSON中间表征,直接输入三维渲染图推理。

8 复现资源、环境与脚本

8.1 依赖软件与库

  1. 几何内核:OpenCASCADE、CadQuery;
  2. 图神经网络:PyTorch Geometric、GraphSAGE、Node2vec;
  3. 向量检索:FAISS;
  4. LLM/VLM:Claude Sonnet 4.6、GPT-4o API;
  5. 可视化:MeshViz、Matplotlib、2048分辨率渲染工具;
  6. 数据集:MFCAD++(59665个CAD零件加工标注数据集)。

8.2 环境一键安装脚本

# 1 基础依赖sudoaptinstallpython3 python3-pip libocct-dev-y# 2 CAD几何库pipinstallcadquery opencascade-python# 3 图学习库pipinstalltorch torch_geometric faiss-cpu# 4 LLM与可视化依赖pipinstallopenai anthropic matplotlib numpy# 5 项目代码(论文配套仓库)gitclone https://github.com/AgentsCAD/cad-dfam-llmcdcad-dfam-llm

8.3 完整运行脚本

# 1 GraphSAGE模型训练(MFCAD++数据集)python train_graphsage.py--featureuv--datasetmfad_plus# 2 单STEP零件DFAM全自动优化python agentscad_pipeline.py--inputbirdhouse.step\--llm_provideranthropic\--vlm_provideropenai\--output./optimized_model.step\--report./dfam_report.md# 3 仅运行特征可视化MeshVizpython meshviz.py--modelbirdhouse.step--weightgraphsage_uv.pth

8.4 资源下载地址

  1. 论文PDF完整文档:https://arxiv.org/pdf/2607.02448v1
  2. AgentsCAD开源代码仓库:https://github.com/AgentsCAD/cad-dfam-llm
  3. MFCAD++数据集下载:论文仓库data目录内置下载脚本
  4. GraphSAGE预训练权重:仓库release页面
  5. 鸟屋测试STEP样例:仓库examples/birdhouse.step

附录补充

  1. 完整MCP工具提示词模板;
  2. GraphSAGE网络完整训练超参;
  3. 鸟屋模型原始/优化STEP文件;
  4. 所有实验定量消融完整表格;
  5. 完整DFAM报告输出模板。

图片说明

原文PDF内含全部图表(网页版无图片资源,仅保留图文字描述与Mermaid复刻流程图):

  1. 图1:AgentsCAD多智能体流水线总流程图;


3. 图2:MeshViz零件特征着色可视化图;
(a)Original Part

(b)Predicted (97% face acc.)

  1. 图3:鸟屋模型优化前后四视图对比图;
    (a)Original Birdhouse CAD input

    (b)Modified Birdhouse CAD output
http://www.cnnetsun.cn/news/3155180.html

相关文章:

  • PIC18F4620与25CSM04 EEPROM的SPI数据存储与检索优化
  • 3大核心技术突破:JX3Toy如何重新定义剑网3游戏体验
  • 5分钟掌握视频硬字幕提取:本地AI工具让你告别手动转录
  • PIC18F56K42与DC-DC降压转换器的嵌入式电源设计
  • 原神帧率解锁终极指南:3分钟实现120帧流畅游戏体验
  • ASM330LHH与PIC32MZ2048EFH144运动跟踪系统设计
  • ASM330LHH与PIC18F2620在运动跟踪系统中的应用与优化
  • NetBird 很火,但个人项目不用先搭 Mesh:用 cpolar 先跑通内网服务远程访问
  • STM32外部EEPROM扩展与I2C接口应用实践
  • RAID级别有哪些?一文教你选对最适合自己的RAID
  • Windows Cleaner:彻底解决C盘空间不足的终极清理工具
  • STM32驱动WS2812灯带:硬件配置与软件优化
  • STM32与TPS65263的三重降压电源管理方案解析
  • STC3115与PIC32MZ电池管理方案设计与实现
  • 如何快速上手EhViewer:打造你的专属漫画阅读体验
  • MAX9744与PIC32MZ2048EFH144在音频功率放大中的高效应用
  • MAX9744与PIC18F86J10实现高效D类音频放大方案
  • iOS 26.4越狱终极指南:从新手到高手的完整解锁方案
  • 高斯分布 Python 3.11 实战:5个真实数据集拟合与3种可视化对比
  • Windows桌面焕新之旅:用TranslucentTB打造个性任务栏的完整指南
  • 低成本工业控制器按键方案:74HC32与PIC32MZ实现多功能控制
  • 3个步骤搞定Zotero中文文献管理:茉莉花插件完全指南
  • LTC6903与PIC18LF25K42构建数字控制振荡器系统
  • LTC6903与MKV44F数字控制振荡器设计与实现
  • PUBG罗技鼠标宏压枪脚本:从零开始掌握精准射击的终极指南
  • STM32F429ZI与EM3080-W条形码扫描模块集成方案
  • 6DoF运动跟踪技术:从IMU选型到嵌入式实现
  • ParsecVDD:5分钟学会Windows虚拟显示器完整免费方案
  • 嵌入式系统电源管理:三重降压转换器TPS65263实战解析
  • AI DApp 日志诊断:链上失败和前端错误要一起看