当前位置: 首页 > news >正文

AI 已经会写代码了,但它还不太会“交付”

────────

孤松AI记 · 工具观察

Loom 这个项目有意思的地方,不是又做了一个 coding agent,而是试图给 Codex、Claude Code、opencode 这些工具外面套一层交付流程:规划、验证、修复、预览、交接,都要留下证据。

近年用 AI 写代码,最容易产生一种错觉:

好像软件开发已经被解决了。

你给它一句需求,它能写页面、补接口、改样式、加测试。几分钟后,一个 demo 跑起来。那一刻确实挺爽。

但真正麻烦的地方,通常从 demo 之后才开始。

需求有没有被完整实现?

中间改过几轮,原始目标还在不在?

测试是真测过,还是 AI 自己觉得差不多?

浏览器预览有没有证据?

会话一压缩、工具一切换,它还能接着干吗?

这些问题,比"AI 会不会写代码"更现实。

01Loom 切的是什么问题

最近看到一个开源项目:Loom。

它自己的说法是,给现有 coding agent 做一个 open delivery harness。说白了,它不是替代 Codex、Claude Code、opencode,而是给这些 agent 加一层交付流程。

它支持的方向也很明确:把一次开发任务变成规划、实现、验证、修复、预览、交接这一整套循环。

怎么使用?

你不用换掉手上的工具——在 Codex 里本来你打"写个访客登记系统",现在在前面加个@loom就行(Claude Code、opencode 里是/loom),它就从"随手生成"切换成"结构化交付"。

接管之后,它不再一次性把代码吐给你,而是先规划,再一个个任务往下做。想从上次的状态接着干,一句@loom continue;想让它自查一遍,一句@loom review

02真正容易失控的地方

过去我们聊 AI 编程,注意力大多放在模型上:哪个模型代码能力更强,哪个 agent 更会改项目,哪个 IDE 体验更顺。

但真实项目里,模型只是一部分。

长任务真正容易崩的地方,是流程失控

比如做到一半就宣布完成。

比如上下文压缩之后,忘了前面确认过的边界。

比如修了 A,又把 B 搞坏了。

比如明明还有失败日志,却给你一个"已完成"的总结。

Loom 想解决的,就是这类问题。

03它把交付状态留在项目里

它会把项目上下文、任务契约、测试结果、预览证据、修复记录、交接报告这些东西落到项目本地的.loom/里。

这样下一次继续,不是让 agent 凭感觉猜"我现在该干嘛",而是从已有状态恢复。

也正因如此,它对"做完了没"卡得比较死。验证不是 agent 嘴上说句"测过了",而是真去跑烟雾测试、Playwright 那类检查,把日志和错误摘要留下来,没过就生成修复请求、再验一遍。预览也不是截张图——是用本地 Docker Compose 把项目真跑起来给你看。

这个设计不花哨,但很工程。

因为 AI coding 往下走,拼的可能不是谁更会"一次性生成",而是谁更能把一个需求稳定做完。

AI coding 的下一阶段,不只是让 agent 更聪明,而是让它进入一套可复盘、可验证、可交接的工程流程。

这件事没那么性感。

但如果你真的想把 AI 用到实际项目里,而不是只停在 demo,可能缺的正是这一层。

项目链接 · github.com/valkor-ai/loom

如果这些文字能让你少走一段弯路,或者只是会心一笑,那这棵"孤松"就算扎下根了。我们下一篇见。

孤松AI记

把重复交给 AI,把判断留给自己。

http://www.cnnetsun.cn/news/2878321.html

相关文章:

  • 从零到一:我的ISP图像调试工程师成长手记
  • SSM架构学生信息管理系统:含可运行WAR包、MySQL脚本与16张真实界面截图
  • 5分钟打造专业级音乐播放器:foobar2000终极美化方案深度解析
  • 深入解析P89LPC912/913/914:80C51内核的低功耗与时钟系统实战
  • AI Coding 笔试:思路 + 提示词
  • 小程序毕设项目:基于springboot+微信小程序的电子元器件商城 (源码+文档,讲解、调试运行,定制等)
  • SolidWorks C#插件开发一键启动包:含事件响应、UI窗体与模型操作封装
  • 消灭AI“适配地狱”—— 让AI开发回归业务本质
  • 从KF到ESKF:五大滤波算法核心思想与工程选型指南
  • 别再手动重复造轮子了!用C#/Python为PowerMill打造你的专属自动化工具库
  • 统计一月工作时长后顿悟:打字,才是当代职场人的头号效率黑洞
  • VRCX:重新定义VRChat社交管理的智能伴侣
  • 智能图像分层革命:layerdivider如何5分钟将单图变多层的设计神器
  • 085、ISP 寄存器调试入门:从 ISP 厂商手册到寄存器读写工具的调试方法论
  • 别再到处找离线地图了!用高德JS API 2.0 + Vue3 动态获取行政区划GeoJSON数据
  • Python 3.14.6 和 3.13.14 发布:约 400 处改进,3.14 系列带来多项新特性!
  • AI 是不是已经贵到无法替代我们?
  • MSC7119 DSP芯片架构解析与嵌入式系统设计实战指南
  • Nginx配置文件详解【20260611】005篇
  • Qt项目直接调用的NC气象数据读取C++封装库(含netCDF-3/4支持)
  • 【Android】Hilt 依赖注入:原理与最佳实践
  • PCA9956A I2C恒流LED驱动芯片:从原理到实战的完整指南
  • 【零基础小白可用】本地 AI 数字员工 OpenClaw 2.7.9 安装指南(含最新安装包)
  • Windsurf IDE实测:AI原生开发如何重构编程逻辑?
  • 5分钟掌握猫抓Cat-Catch:浏览器资源嗅探神器的终极完整指南
  • 5分钟掌握Chrome图片格式转换:Save Image as Type扩展的终极使用指南
  • 3步精通猫抓神器:浏览器资源嗅探终极使用指南
  • 如何高效进行游戏资源逆向分析:QuickBMS完整实战指南
  • MPC860 PowerQUICC:嵌入式通信处理器的架构解析与实战应用
  • 对话式AI过度依赖:用户行为分析与应对策略