当前位置: 首页 > news >正文

教会一个 AI,它就能去教别的 AI?

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费

新宠

最近我喜欢上一款 AI Harness 框架,就是橘子团队做的 Cola。

你知道的,我用过 Claude Code、Codex、OpenClaw、Hermes 等一系列顶级或者热门的 Harness。按照道理来讲,没理由再用一款新的。

但是这个 Cola 真的有些不一样。

我第一次使用,就觉得这玩意儿「有温度」,甚至可以说,有人味儿。它收到要求后,往往会自言自语一番 —— 接到任务嘀咕一句「好嘞,让我想想怎么搞这个……」,然后自己跟自己讨论方案,一会儿说「这个思路不错」,一会儿又说「等等,这样可能会有问题」。你看着它在那儿自问自答,就像看一个认真干活的人在嘟囔。

原先用起来够贵的,后来接上了 Codex 订阅,终于能用上顶级模型了。连上之后,我选了目前最新的 GPT 5.5,果然智商一下子就上来了。然后,我就开始让它帮我干活了。

但说实话,这个时候我还没意识到,和 Cola 协作时真正有意思的事情,根本不只在于「好用」上。

铺路

我连上 Codex 订阅后,就开始用步步为营的方式,让 Cola 来帮我做事。

比如说,我这学期教机器学习。马上就要讲到推荐算法了。

我看了一眼去年的课件,其实内容不错。

当时我已经用了不少 Agent 帮我生成交互式网页,但在演示的时候,需要和我的主幻灯不断切换,这可不好使。于是,我今年干脆选择自底向上进行 —— 先把 ipynb 准备好,然后一一喂给 Cola。

Cola 一开始不大理解我想干啥,事无巨细都要讲。于是我打断,说明我其实更想要的,是把相关知识点准备好,这样学生再学习代码的时候,就有了知识基础。它马上就心领神会,很快就给我生成了完整的大纲,贴上去就能用。

但我很快就不满意了 —— 这种实操类课程,怎么能全用干巴巴的文字来讲呢?于是加图。

加了图又觉得缺代码,于是插截图。

有了截图又觉得缺讲解,于是加动态配音。每一步都是「当前结果不够好」的直觉,驱动我提出下一个要求。

这个过程,和传统的「先想清楚再执行」完全不同。我并没有一开始就甩给它一份完美的需求文档,说「你要做大纲、加图片、插代码截图、加动态讲解,全部一次搞定」。事实上,我自己也是在交互的过程中,才一点一点真正想清楚我到底要什么的。

为什么会这样?因为很多时候,你只有看到了当前的结果,才知道它缺什么。没看到大纲之前,我不知道大纲太干;没看到图片之前,我不知道缺代码截图;没看到截图之前,我不知道缺动态讲解。你的需求不是凭空想出来的,是在和产出的碰撞中涌现出来的。所以,渐进式引导比一次性完美指令更有效——不是因为你表达能力不够,而是因为认知本身就是渐进的。

这种感觉,真是「渐入佳境」,让我越来越信赖 Cola 了。

困局

不过做着做着,我就觉得不对了。

因为 Cola 目前只能在我的 macOS 上面运行,而且必须得电脑开着,才能使用。一旦笔记本电脑屏幕合上,不好意思,Cola 失联。

据说 Cola 后续会提供云端处理能力。但那是以后的事儿,咱们先说眼下的事实。Cola 占用着我的笔记本电脑工作,却有其余「同事」闲着。

对,说你们呢,Claude Code 和 Codex。而且我说的还不是 macOS 上面的这俩应用,而是远端的

我之前文章中跟你提到过,那边有个 7x24 小时不间断运行的 VPS 在待命。上面这俩家伙都已经安装好,可是都在那里空闲。

我得让它们忙起来,同时降低 Cola 的工作负担。于是我跟 Cola 商量,能不能把这些工作分配给它俩,然后 Cola 来审核。

看到这里估计你快绷不住了。Claude Code 和 Codex 都是顶级框架加顶级模型,你怎么能这么用?简直暴殄天物啊。

不,这叫「重器轻用」。

它们都很厉害,但是仅就交互的满意程度而言,目前我觉得 Cola 加 GPT 5.5 比这俩都要更符合我的需求。再说了,在前面的过程里,我几乎是手把手教 Cola。这些教学结果,也得派上用场啊。

那么,让 Cola 作为和用户(也就是我)的交互端,只负责发指令、收成果。那俩家伙在远端无休开跑干活儿,岂不是两全其美?

理想很丰满。但现实很快就给我上了一课。

挫折

先说第一次碰壁吧,我称之为空气交付。

Cola 尝试去连接 VPS,并且查看两个 Agent 可调用情况。很快,它就摸清了链路,然后让它俩跑个样例出来。

但我很快就发现不对了。

Cola 给远端 Agent 分配任务的时候,只给它们安排了非常轻的活 —— 让它们把计划做好。我实际上的想法,是让它们实际去把之前只生成了图片的部分,补上动态效果,并加上代码和重点的结果截图。但我发现它只是把那些东西都换成占位符,就直接反馈回来了。

什么意思呢?远端 Agent 交上来的东西,所有该有真实内容的地方,全是R2_TODO—— 图片没有真实截图,模块没有真实文件,只有一个个标记着「待办」的占位符。

就好像你让一个实习生写报告,他交上来一份提纲,每个章节标题下面写着「此处待补充」,然后跟你说:做完了。

你说气不气?

但冷静下来想想,这到底是谁的问题?远端 Agent 这么做,其实挺合理的——没人告诉它「交付物必须是完整的」。Cola 在派活的时候,把任务定义成了「做个规划」,远端 Agent 就真的只做了规划。Agent 天然倾向于把活儿往轻了做,因为完成一个轻任务比完成一个重任务更容易达标。如果你不说清楚「我要的是成品,不是计划」,那它给你个计划,有毛病吗?

没有。

我对当下的结果,自然是非常不满,于是让 Cola 把那些进一步的要求,也就是这些实际干活的活,都委派给这些 Agent。

Cola 也照做了。

不过很快,我就遭遇了第二次碰壁:微操陷阱。

Cola 给出的计划是:由远端去生成素材,然后由它自己对素材进行进一步的加工。例如:图片的上传,这些 module 的推送同步,这些竟然都由它来做。

我于是愈发地不满。

但这一次,我多想了一步:它到底错在哪儿?

表面上看,Cola 确实把活分出去了 —— 远端生成素材,它来做后续加工。看起来合理,分工明确。但仔细想想,图片上传、module 推送这些活儿,哪个离了 Cola 就干不了?哪个是远端 Agent 无法真正独立完成的?

答案是:没有。

因为 Cola 大包大揽,远端 Agent 在这个方案里,本质上只是一个素材供应商。真正把东西做成成品的环节 —— 上传、同步、整合 —— 全都揽在 Cola 自己手里。

Cola,你以为你在委派,其实你在微操。

http://www.cnnetsun.cn/news/2652050.html

相关文章:

  • 行为设计四步法:从情绪管理到时间规划,打造不可分心的深度工作系统
  • 内存计算架构原理、实现与应用解析
  • Windows右键菜单终极管理指南:用ContextMenuManager让右键菜单秒开如飞
  • 用Unity UGUI ScrollRect做个游戏公告板:支持鼠标悬停暂停的自动循环滚动条
  • Oura Ring 5 登场!更小更舒适,价格虽涨但这些升级值得一试
  • Unity 2020内置管线实战:用Filament PBR模型给你的布料Shader加上丝绸般各向异性高光
  • 空洞骑士模组管理神器Scarab:3分钟快速上手指南
  • 聊天机器人开发:如何用自然语言交互降低技术使用门槛
  • ADS1262/ADS1263高精度ADC嵌入式驱动包:C++封装,支持双通道采集、IDAC配置与系统校准
  • 采购审批 Agent:预算校验、供应商评分与合规红线设计
  • C#编写的Atlas拧紧枪TCP通信调试工具,含OpenProtocol协议解析与实时数据监控
  • ULINK2调试器在ST-uPSD开发中的双重验证机制解析
  • 别再手动写脚本了!用Node-RED的redis-cmd节点,像搭积木一样操作Redis
  • 别再只把I²S当音频接口了!解锁ESP32-C3 I²S的隐藏玩法:驱动数字麦克风与TDM多声道
  • 告别编译噩梦:用 CP2K 官方 Toolchain 脚本在 Ubuntu 上自动化部署(含 MKL 和 GCC 配置)
  • 全网公认最好用的格式转换工具-“格式工厂”!支持音视频文档全搞定,超良心!
  • 四套免配置HTML个人主页源码:背景图/极简/卡片/星空动效,改文字换图就能用
  • 8051内存管理:DATA_GROUP优化与实战技巧
  • 负载均衡:多实例分担执行压力
  • 构建智能知识管理系统:从信息孤岛到客户体验中枢
  • GD32F103 ADC采样时,LM358输出为啥会飘?一个硬件工程师的踩坑实录
  • Python微信个人号自动化工具包(itchat源码+Py3.12编译文件)2024实测可用
  • 告别触屏!用Manomotion SDK在Unity里为你的AR模型加上‘隔空操控’魔法
  • AI写作泛滥:内容产业的挑战与应对策略
  • 从硬件连线到软件定位:RK3588外挂中科微GPS模块的全链路调试记录
  • Claude用户手册制作全流程拆解(含Prompt架构图谱+权限分级模板)
  • 物理渗透测试实战指南:从社会工程学到门禁突破
  • 别再只用TileMap了!用Godot4.2的AStar2D为你的战棋游戏打造动态寻路系统
  • AI解决方案营销实战:破解技术价值传递与商业落地的七大挑战
  • AI代理生产落地:从数学、成本到工程实践的硬核拆解