当前位置：首页 > news >正文

[具身智能-558]：用OpenDevin（前端+沙箱） + LangGraph（编排） + MCP Tools（外设）构建自己的AI编程智能体IDE.

news 2026/6/30 6:33:21

利用OpenDevin（前端 + 安全沙箱） + LangGraph（智能体编排） + MCP Tools（标准化外设），你可以构建一个功能完整、可扩展、安全可控的 AI 编程智能体 IDE——这正是 TRAE、Cursor Agent 等商业产品的开源技术栈雏形。

下面我将为你提供一套可落地的架构方案，包括模块职责、集成方式、代码示例和部署建议，助你从零搭建自己的“AI 工程师操作系统”。

🧩 整体架构：三层融合模型

+--------------------------------------------------+ | 用户界面（Web / VS Code） | | ← 基于 OpenDevin 前端（React + WebSocket）| +--------------------------↑----------------------+ | 自然语言请求 +--------------------------------------------------+ | 智能体编排引擎（LangGraph + Python） | | - 任务解析 → 规划 → 执行 → 验证 → 反思 | | - 调用 Skill（内置）或 MCP Tool（外部） | +------------------↑-------------------↑------------+ | | +--------↓--------+ +-------↓--------+ | LLM 推理层 | | MCP Tools | | (OpenRouter/Qwen)| | (文件/测试/Shell)| +-----------------+ +-----------------+ ↑ +--------↓--------+ | 安全沙箱 | | (OpenDevin Sandbox)| +-----------------+

一、核心组件选型与职责

组件	作用	开源项目	关键能力
OpenDevin	提供Web IDE 前端 + 安全执行环境	github.com/OpenDevin/OpenDevin	- 浏览器内 VS Code-like 编辑器 - Firecracker 微虚拟机沙箱 - 文件系统隔离
LangGraph	构建状态化、可循环的智能体工作流	langchain-ai.github.io/langgraph	- 有向图状态机 - 支持 human-in-the-loop - 多智能体协作
MCP Tools	标准化外部工具接口	github.com/model-context-protocol	- 统一 Tool 描述（YAML） - 权限控制 - 自动发现

✅ 三者互补：
OpenDevin =Shell + Terminal + Security
LangGraph = Kernel Scheduler
MCP = Device Drivers

二、关键集成步骤

步骤 1：启动 OpenDevin 沙箱与前端

Bash

# 克隆并启动 OpenDevin git clone https://github.com/OpenDevin/OpenDevin.git cd OpenDevin docker compose up --build

默认访问http://localhost:3000，即可获得：

Web IDE 编辑器
内置/workspace目录（沙箱隔离）
WebSocket API 用于接收指令

💡 你也可以将其嵌入 VS Code 插件（参考 OpenDevin 的vscode-extension分支）。

步骤 2：定义 MCP Tools（你的“外设驱动”）

在项目根目录创建.mcp/tools/：

Yaml

# .mcp/tools/run_pytest.yaml name: run_pytest description: "Run pytest in sandbox" parameters: test_file: { type: string, required: true } permissions: filesystem: read network: deny

Yaml

# .mcp/tools/write_file.yaml name: write_file description: "Write content to file" parameters: path: { type: string } content: { type: string } permissions: filesystem: write

✅ 这些工具将被 LangGraph 自动加载，并在沙箱中安全执行。

步骤 3：用 LangGraph 构建智能体编排器 - 后端

创建agent.py：

Python

from langgraph.graph import StateGraph, END from typing import TypedDict, List import mcp # 使用官方 mcp-client 库 # 定义状态 class AgentState(TypedDict): user_request: str plan: List[str] current_task: str observations: List[str] output: str # 节点：规划 def planner(state: AgentState): prompt = f"将任务分解为子步骤: {state['user_request']}" plan = llm_call(prompt) # 调用你的 LLM（如 Qwen via OpenRouter） return {"plan": plan.split("\n")} # 节点：执行（调用 MCP Tool） def executor(state: AgentState): task = state["plan"].pop(0) if "test" in task.lower(): result = mcp.call("run_pytest", {"test_file": "test_main.py"}) elif "write" in task.lower(): result = mcp.call("write_file", {"path": "output.py", "content": "..."}) else: result = "SKIPPED" return { "current_task": task, "observations": [result], "plan": state["plan"] } # 节点：验证 & 反思 def verifier(state: AgentState): if "FAILED" in state["observations"][-1]: return {"plan": ["重试修复错误"]} else: return {"output": "任务完成！"} # 构建图 workflow = StateGraph(AgentState) workflow.add_node("planner", planner) workflow.add_node("executor", executor) workflow.add_node("verifier", verifier) workflow.set_entry_point("planner") workflow.add_edge("planner", "executor") workflow.add_edge("executor", "verifier") # 支持循环：若需重试 def should_retry(state): return "executor" if "重试" in state.get("plan", []) else END workflow.add_conditional_edges("verifier", should_retry) app = workflow.compile()

步骤 4：连接 OpenDevin 前端

通过 WebSocket 或 REST API将用户（Web前端）的输入传给 LangGraph：

Python

# server.py (FastAPI) from fastapi import FastAPI from agent import app app_api = FastAPI() @app_api.post("/execute") async def execute(request: dict): result = app.invoke({ "user_request": request["query"], "plan": [], "observations": [], "output": "" }) return {"result": result["output"]}

前端（OpenDevin）调用：

// 在 OpenDevin 前端 JS 中 fetch("/execute", { method: "POST", body: JSON.stringify({ query: "修复登录 bug 并添加测试" }) })

步骤 5：LLM 接入（推理层）

使用OpenRouter或Ollama 统一接入多模型：

Python

# llm.py import openai def llm_call(prompt: str) -> str: client = openai.OpenAI( base_url="https://openrouter.ai/api/v1", api_key="YOUR_KEY" ) resp = client.chat.completions.create( model="qwen/qwen-max", messages=[{"role": "user", "content": prompt}] ) return resp.choices[0].message.content

三、进阶能力扩展

功能	实现方式
Skill 标准库	在 LangGraph 中注册`/fix`节点，封装固定 prompt
上下文压缩	用 LLM 自动摘要对话历史，注入新轮次
多智能体协作	创建 PlannerAgent / CoderAgent / TesterAgent 子图
Human-in-the-loop	LangGraph 支持`interrupt_before=["review"]`，暂停等待确认
日志追踪	集成 LangSmith，记录每步推理与 Tool 调用

四、部署建议

开发环境：Docker Compose 一键启动（OpenDevin + FastAPI + Sandbox）
生产环境：Kubernetes 部署，每个用户会话分配独立沙箱 Pod
安全：MCP 权限 + 沙箱网络隔离 + LLM 输出过滤

五、与 TRAE 的差距与优势

维度	你的开源版	TRAE
Skill 质量	需自行优化 prompt	平台级 A/B 测试优化
调度性能	Python 单线程瓶颈	Go 内核高并发
用户体验	基础 Web IDE	深度集成 VS Code 插件
开放性	✅ 完全可控、可定制	❌ 闭源
成本	✅ 可本地运行	依赖云服务