当前位置: 首页 > news >正文

我让 Claude 写了一个贪吃蛇游戏,然后用 ccglass 看清它发给模型的真实请求AI 编程 Agent 越来越强。

现在我们已经不只是让模型补全一段代码,而是直接让 Claude Code、Codex、OpenCode 这类工具读项目、写文件、调用命令、修改代码、完成一整个开发任务。

但随之而来的问题是:Agent 的执行过程越来越像黑箱。

我们通常只能看到最后结果,却不容易知道:

  • 它到底把什么内容发给了模型?
  • system prompt 里有哪些规则?
  • 当前任务的上下文是怎么组织的?
  • 模型看到了哪些工具?
  • 它如何决定写入文件?
  • token、cache、latency 这些指标到底是多少?

为了把这个过程看清楚,我用一个很小的 demo 做了一次实验:让 Claude Code 从零生成一个贪吃蛇小游戏,同时用 ccglass 记录整个请求过程。

ccglass 项目地址:

https://github.com/jianshuo/ccglass

补充说明:这次演示里,我使用的是第三方模型 API,上游是阿里云 DashScope 的 Anthropic 兼容接口,并不是直连 Anthropic 官方 API。ccglass 在本地作为代理接入 Claude Code,记录本地代理收到的请求,再转发到配置好的上游服务。因此,截图里可以看到 Claude Code、Anthropic 兼容协议和阿里云上游一起出现。

这次 demo 做什么?

这次任务很简单:让 Claude Code 在demo-snake目录里从零创建一个可以直接打开的贪吃蛇小游戏。

我给 Claude 的要求是:

请在当前目录 demo-snake 里从零创建一个可以直接打开的贪吃蛇小游戏。 要求: 1. 使用纯 HTML/CSS/JavaScript,不依赖外部框架。 2. 生成 index.html、style.css、game.js 三个文件。 3. 支持方向键控制。 4. 显示当前分数和最高分。 5. 撞墙或撞到自己后游戏结束。 6. 支持点击按钮重新开始。 7. 页面风格做得稍微精致一点,适合截图展示。 8. 完成后告诉我如何在浏览器打开测试。 这次 demo 的记录重点不是游戏本身,而是 Claude 生成这个游戏时,ccglass 看到什么。

先启动 ccglass,选择 Claude Code,然后在 Claude 里输入这段任务。

从终端可以看到,ccglass 读取到 Claude Code 配置中的上游地址,并将请求转到本地代理。这里的上游是:

https://dashscope.aliyuncs.com/apps/anthropic

也就是说,这次 demo 的调用链路大致是:

Claude Code -> ccglass 本地代理 -> 阿里云 DashScope Anthropic 兼容接口 -> 模型

这里的重点不是“Claude 能不能写一个小游戏”。这个任务足够简单,很多 AI 工具都能完成。

真正值得看的,是它在生成这个游戏时,背后发给模型的请求到底长什么样。

用 ccglass 观察 Claude Code 的请求

ccglass 是一个面向 AI 编程 Agent 的本地观测工具。它通过“本地代理 + Web Dashboard”的方式,记录 Claude Code、Codex、DeepSeek、Kimi、OpenCode 等工具实际发给模型 API 的请求和响应。

启动后,ccglass 会把 Claude Code 的请求转到本地代理,再转发给真实上游。这样我们就能在 Dashboard 里看到请求内容。

在这次 demo 中,ccglass 记录到了多轮请求。左侧可以看到每一轮请求的模型、耗时、消息数量、工具数量和 HTTP 状态。

这张图里有几个信息很关键:

  • provider 是 Anthropic 兼容接口;
  • 上游模型来自第三方 API,这次使用的是阿里云 DashScope;
  • 请求不是一次性的,而是多轮追加;
  • 每一轮都有 latency;
  • 请求里包含 messages;
  • 后续请求里包含 tools;
  • Claude 在过程中出现了Write工具调用,准备写入文件。

这就把“Agent 在背后做了什么”从猜测变成了可观察事实。

不只是用户 prompt,还包括系统上下文

很多人以为 AI Agent 发给模型的内容就是“用户输入的那句话”。

但实际请求远比这复杂。

在 ccglass 的 messages 视图里,可以看到这次请求包含了系统提醒、当前日期、用户任务,以及后续的 assistant 内容。

可以看到,Claude 收到的不只是“写一个贪吃蛇游戏”。

请求里还会包含类似这样的上下文:

  • 当前日期;
  • system-reminder;
  • 用户完整需求;
  • 工作目录信息;
  • 前几轮 assistant 内容;
  • 已发生的工具调用结果;
  • 后续模型需要继续处理的上下文。

这也是为什么 AI Agent 有时候表现得像“知道很多现场信息”:它不是凭空知道的,而是这些上下文被组织进了模型请求。

对于开发者来说,这一点非常重要。

如果 Agent 跑偏了,我们不能只看最后回复,而应该回到请求里检查:模型到底看到了什么?它是不是缺了关键上下文?是不是带了太多无关信息?是不是工具结果影响了下一轮判断?

ccglass 的价值就在这里。

模型看到了哪些工具?

AI 编程 Agent 和普通聊天机器人最大的区别之一,是它可以调用工具。

比如读文件、写文件、运行命令、搜索代码、启动子任务等。

但模型能不能正确使用工具,很大程度取决于工具 schema 和描述写得怎么样。

在 ccglass 的 tools 视图里,可以看到 Claude Code 暴露给模型的工具定义。

这张图展示的是工具定义,而不是最终工具调用结果。

它告诉我们:模型在这一轮请求里能看到哪些工具、这些工具什么时候该用、参数 schema 是什么。

比如 Agent 工具的描述里会说明:

  • 什么时候应该启动一个新 agent;
  • 每种 agent type 有不同能力;
  • 使用工具时需要指定参数;
  • 工具结果会如何返回。

同理,Claude Code 还会向模型提供写文件、读文件、运行命令等工具。模型根据这些工具描述,决定下一步如何行动。

这对调试 Agent 很有帮助。

如果某个工具经常被误用,问题可能不在模型本身,而在工具说明、参数设计或上下文组织方式上。

从需求到文件写入

这次 demo 的任务是生成三个文件:

  • index.html
  • style.css
  • game.js

Claude 在分析任务后,开始把用户需求转成实际文件。

在 ccglass 的记录里,可以看到 Claude 的 response 和后续状态。最后它总结已经创建了三个文件,并提示下一步在浏览器中打开index.html测试。

http://www.cnnetsun.cn/news/3052602.html

相关文章:

  • 从满额到冻结:ChatGPT Plus额度耗尽后的72小时连锁反应(含API错误码对照表+应急回滚方案)
  • AI视频生成神器Pixelle-Video:3分钟让普通人变身视频创作高手
  • Python笔记(二):Conda 常用命令总结
  • 我的惠普tank2606打印机屏幕突然提示ER08,碳粉灯亮黄色灯,之后我加了2包碳粉,问题依旧,到维修店,师傅说要换配件,费用大概400左右,太贵没有修就带回来了,之后发现了这个软件,一分钟修好了。
  • 地产三维动画制作公司怎么选:从技术路线到交付保障的完整决策框架
  • 3分钟上手FunClip:如何用AI智能剪辑让视频处理效率提升10倍?
  • CQRS的两种设计方式
  • 基于SpringBoot的学生选课系统设计与实现
  • 计算机毕业设计之电影购票推荐网站的设计与实现
  • YOLO轻量化与部署优化- 第80篇:模型压缩与部署的综合优化指南
  • 记一次 .NET 某注塑模具系统 CPU爆高分析
  • Docker--认识Docker网络
  • FMEA×控制计划×PPAP自动联动,这才是研发管理的天花板-全星研发项目管理APQP软件系统#APQP #PLM #汽车电子 #芯片研发 #新能源 #项目管理软件
  • MSP430 ADC模块深度解析:从寄存器配置到低功耗设计实战
  • | LiveMoments 用参考图引导的扩散模型提升重选封面帧画质
  • 如何通过4个维度全面提升Windows系统性能?
  • 从TPA3111D1评估板到自主设计:D类音频功放实战指南
  • 百度网盘秒传转存终极指南:3分钟掌握全平台快速分享技巧
  • 基于Feign+Resilience4j的微服务熔断防雪崩优化方案
  • 为什么92%的ChatGPT Plus订阅在第3个月自动降级?国内用户必须知道的OpenAI账户健康度监测协议(含自动续费预警脚本开源)
  • 如何在 Python 项目中避免循环引用
  • Win11Debloat:让Windows 11重获新生的终极优化工具
  • 2026 Q1企业级大模型运营治理平台实测排行|合规效率双维度深度对比
  • MATLAB | MATLAB 也可以画 Mantel test 相关性热图了?
  • 深耕綦江十六年:綦江万汇家居建材如何成为本土家居服务商的标杆
  • ⚡SimpleDAO 企业实战教程(06) mergeParams 多组条件合并
  • 卫星合成孔径雷达技术解析 穿透云雨雾霾实现全天时对地探测
  • DRV10964评估板实战:BLDC电机驱动硬件拆解、配置与调优指南
  • 靠《堡垒之夜》游戏录像训练AI,General Intuition获3.2亿美元融资!
  • Conda 环境一键搬家:用 conda-pack 打包带走,连网都不用