Codex 接入 SolidWorks 教程:MCP、COM 接口、Computer Use 三条路径对比

我写后端代码写了将近十年,最近一年多一直在折腾 AI 工程化的东西——怎么把大模型接进实际的工作流,而不只是停留在聊天框里。所以当我看到有人把 Codex 接进 SolidWorks 自动建模,第一反应不是"AI 要替代工程师了",而是:它到底是怎么连进去的?

这个问题比"效果好不好"更值得先搞清楚。因为连接方式决定了能力边界,也决定了你踩坑的位置。


先说清楚:Codex 凭什么能操控 SolidWorks

很多人看到演示截图,以为 Codex 是某种专门为 SolidWorks 训练的 AI。实际上不是。Codex 本质上是一个具备工具调用能力的 AI Agent,它能操控 SolidWorks,靠的是外部接口,而不是内置的 CAD 知识。

这个区别很重要。它意味着:

  1. Codex 的建模能力上限,取决于你给它的接口质量
  2. 接口越标准、反馈越清晰,Codex 表现越好
  3. 接口越模糊、错误信息越含糊,Codex 就越容易在那里转圈

目前把 Codex 接进 SolidWorks 主要有三条路径,原理完全不同,适用场景也不一样。


路径一:MCP 协议(推荐,但有门槛)

MCP(Model Context Protocol) 是 Anthropic 在 2024 年 11 月提出的开放标准,定义了 AI 应用和外部工具之间的通信方式。可以把它理解成 AI 世界的 REST API 规范——不是某家公司的私有协议,而是一套大家都能实现的接口标准。

Codex 支持作为 MCP 客户端接入各种 MCP Server。GitHub 上已经有人开发了 mcp-server-solidworks,把 SolidWorks API 包装成 MCP 兼容的工具集,让 Codex 可以通过标准化的 tool call 来调用建模操作。

这条路径的工作原理大致是:

Codex(MCP Client)
    ↓ tool call(JSON)
MCP Server(本地运行)
    ↓ 调用
SolidWorks API(COM 接口)
    ↓ 返回结果
MCP Server → Codex

Codex 发出一个结构化的工具调用请求,比如"创建一个直径 50mm、高 80mm 的圆柱体",MCP Server 把这个请求翻译成 SolidWorks API 调用,执行完再把结果(成功/失败/当前模型状态)返回给 Codex。

优点:

  • 接口标准化,Codex 能拿到清晰的执行结果和错误信息
  • 可以精确控制暴露哪些操作,不会让 AI 乱点界面
  • 理论上可以在无界面(headless)模式下运行

坑点:

  • 需要自己部署和维护 MCP Server,有一定开发成本
  • 现有的开源 MCP Server 质量参差不齐,工具覆盖不全
  • SolidWorks 的 COM 接口本身就有很多历史包袱,封装进 MCP 后错误处理更复杂
  • 必须是正版 SolidWorks(COM 接口需要授权)

适合谁: 有一定编程基础、愿意花时间调试、需要稳定可重复执行的场景。比如批量生成标准件、参数化建模流水线。


路径二:COM 接口直接调用(最底层,最灵活)

SolidWorks 本身就有一套完整的 自动化 API,基于 Windows COM(Component Object Model)技术,支持 VBA、VB.NET、C# 等语言调用。这套接口存在了二十多年,文档齐全,功能覆盖几乎所有建模操作。

Codex 接管 SolidWorks 的另一种方式,是让 Codex 直接生成调用这套 COM 接口的代码,然后在本地执行。流程大概是:

用户描述需求(自然语言)
Codex 生成 VBA/Python 脚本
本地执行脚本 → 调用 SolidWorks COM API
SolidWorks 执行建模操作

这条路径不需要额外的 MCP Server,Codex 扮演的是"代码生成器"的角色,而不是实时 Agent。

优点:

  • 不需要额外基础设施,有 SolidWorks 就能跑
  • COM 接口功能最全,几乎没有操作盲区
  • 生成的脚本可以保存复用,不用每次都烧 token

坑点:

  • Codex 生成的代码不一定能一次跑通,COM 接口的错误信息对 AI 不友好
  • 复杂模型需要拆成多步,每步都要人工确认再继续
  • 没有实时反馈,Codex 不知道当前模型状态,容易在错误上叠加错误
  • 有人测试过,一个鼠标零件大概需要 2000 行 VBA 代码,而 Codex 单次输出有长度限制,分段执行时上下文容易断

这条路径更像是"AI 辅助编写宏",而不是"AI 自主建模"。对于有一定 SolidWorks 宏开发经验的人来说,效率提升很明显;对于完全不懂 API 的人,调试成本可能超出预期。


路径三:Computer Use 直接操控屏幕(最直观,最不稳定)

OpenAI 在 2026 年初为 Codex 加入了 Computer Use 功能,让 Codex 可以像人一样看屏幕、移动鼠标、点击按钮、输入文字。Mac 版先上,Windows 版在 2026 年 3 月跟进。

这条路径不需要任何 API 接口。Codex 直接"看着"SolidWorks 的界面操作,就像一个远程控制的人类用户。

优点:

  • 零接入成本,不需要写任何代码或配置
  • 理论上能操控任何有界面的软件,不限于 SolidWorks
  • 对于没有 API 的老旧软件,这是唯一可行的路径

坑点:

  • 稳定性差,界面稍有变化(弹窗、分辨率、主题)就可能失败
  • 速度慢,每一步操作都需要截图→分析→决策→执行,延迟高
  • 无法精确控制,Codex 可能点错地方,而且很难检测到
  • token 消耗极高,因为每一帧截图都要处理
  • 不适合需要精确尺寸输入的场景,手动输入数字容易出错

实际测试中,有人用这条路径建一个减速器模型花了将近 100 分钟,而且最终结果还需要大量人工修正。这不是 Codex 的问题,而是 Computer Use 这种交互方式本身的局限——它是最后的兜底方案,不是主力方案。


三条路径怎么选

MCP 协议COM 直接调用Computer Use
接入难度中(需部署 Server)低-中(需懂 API)低(开箱即用)
执行稳定性
精度控制
Token 消耗极高
适合场景批量/流水线单次复杂建模无 API 的软件
需要正版软件

如果你是程序员,想把 AI 建模接进实际工作流,MCP 路径是值得投入的。前期搭建成本高,但一旦跑通,后续可以持续复用,而且接口标准化意味着以后换模型(从 Codex 换成别的 Agent)成本很低。

如果你只是想试试效果,COM 直接调用是最快的起点。让 Codex 帮你生成一段 VBA 宏,在 SolidWorks 里跑一下,看看能到什么程度。不需要任何额外配置。

Computer Use 适合探索,不适合生产。


一个容易被忽略的前提

不管走哪条路径,有一个问题在实际使用中会反复出现:Codex 不理解物理世界

这不是在贬低 AI,而是一个工程事实。Codex 生成的建模步骤,在语法上可能完全正确,但在物理上可能毫无意义——比如两个零件的配合公差不对、螺纹方向反了、装配约束缺失。

这和 AI 写代码不一样。代码跑起来会报错,错误信息直接告诉你哪里出了问题。SolidWorks 建出来的模型"看起来没问题",但只有懂机械的人才能判断它能不能用。

所以目前这套工作流的合理定位是:AI 负责执行,工程师负责判断。AI 帮你把重复性的建模操作自动化——比如批量生成标准件、根据参数表生成变体——工程师负责审查结果、处理异常、做最终决策。

有个做复合材料仿真的朋友跟我说,他最希望 AI 能做的,不是帮他"设计",而是帮他自动完成铺层参数赋值、表面识别、材料方向划分这类重复操作——每次手动做要花几个小时,但逻辑完全固定。这个需求用 MCP 路径完全可以实现,而且效果会比"让 AI 自由建模"稳定得多。


实际上手前的几个检查项

如果你打算动手试,建议先确认这几件事:

  1. SolidWorks 版本和授权:COM 接口和 MCP Server 通常需要正版授权,盗版可能在 API 调用时报错
  2. Codex 订阅等级:Computer Use 功能需要 Plus 及以上,MCP 集成在 Pro 下体验更稳定,token 消耗不容小觑
  3. 从简单模型开始:单个零件、几何形状规则、尺寸标注完整——这是 AI 建模成功率最高的场景,复杂装配体先别碰
  4. 准备好工程图:给 Codex 的输入越结构化越好,完整的二维工程图(含尺寸、公差、装配关系)比自然语言描述效果好得多
  5. 建立验证流程:AI 生成的模型必须有人审查,不要直接拿去出图或加工

这件事现在还处于"能跑通但不稳定"的阶段。但方向是对的,接口在完善,模型在迭代。

值得花时间搭一套自己的工作流,而不是等它"成熟了再说"——等它成熟的时候,先动手的人已经把流程跑顺了。


常见问题

Codex 需要正版 SolidWorks 吗?

MCP 路径和 COM 路径都需要。SolidWorks 的自动化 API 是通过 COM 注册表暴露的,盗版软件通常不注册这些接口,调用时会直接报错。Computer Use 路径理论上不依赖 API,但盗版软件的弹窗和功能限制会严重干扰 AI 操作。结论:想正经用,正版是前提。

Codex Plus 够用吗?还是必须升 Pro?

取决于你的使用频率。Plus 每 5 小时刷新一次额度,如果你只是偶尔建几个简单零件,Plus 够用。但如果你在调试 MCP Server 或者跑复杂装配体,一个任务可能就把 5 小时额度烧完——这种情况下 Pro 的体验会好很多。Computer Use 路径因为每步都要处理截图,token 消耗是 MCP 路径的 5-10 倍,用 Plus 基本不够。

一个模型大概消耗多少 token / 花多少钱?

差异很大。一个简单的旋转体零件(法兰盘、轴套),MCP 路径大概消耗 5-15k token;一个中等复杂度的零件(带孔阵列、倒角、螺纹)可能到 50-100k token。按 GPT-5 Codex 的定价估算,单个简单零件成本在几毛到一两块人民币,复杂装配体可能到几十块。相比之下,Computer Use 路径同样的模型可能花费 10 倍以上。

DeepSeek 能替代 Codex 接 SolidWorks 吗?

目前不太行。DeepSeek 的图像理解能力较弱,无法有效解析工程图纸,这在需要"看图建模"的场景中是硬伤。纯文字描述驱动的简单建模可以尝试,但效果和 GPT-5 Codex 有明显差距。如果你主要用 COM 路径(让 AI 生成 VBA 代码),DeepSeek 的代码生成能力可以一试,但要做好多轮调试的准备。