Agent 市场血雨腥风,MiniMax 多 Agent 架构引领变革,重塑行业格局?
Agent 市场竞争激烈,MiniMax 搅动风云
Agent 的世界,四月山雨欲来,五月血雨腥风,行业加速迅猛。Vibe Coding 不再新鲜,编程赛道拥挤,Claude Code、Codex 等贴身肉搏,黑话流行,去年 skill 当道,如今 harness 称王。热词之下,Opus、GPT 等模型在写代码和执行复杂任务上表现出色,但拉开模型公司差距的是外面的壳。研究报告显示,Claude Code 泄露代码中仅 1.6% 为模型决策代码,98.4% 是 harness。全新一代 agent 产品涌现,Grok Build 等纷纷推出,DeepSeek 也在招人组建 agent 开发队伍。早布局 agent 的 MiniMax 在 5 月中旬桌面端推出 Agent Team 功能,随 M3 旗舰模型发布,桌面端升级为 MiniMax Code,搅动 agent 市场。
Agent Team 架构特色及 MiniMax 思路
Agent Team 内核是 Leader - Worker - Verifier 的「对抗式」架构,干活和挑错职责分离,受状态机管理,上下文隔离,专治长程 agent 任务顽疾。MiniMax 未等 M3 先在 M2.7 推出 Agent Team,M2 被称为「大巧若拙」,M3 会更强。训练 M3 关键时期,APPSO 与 MiniMax Agent 研发工程师择因对谈,探讨 Agent Team 设计原则等。业界认为 Anthropic 有好模型但工程差,其不信任模型,处处约束;OpenAI 的 harness 极简,不同框架效果不同。MiniMax 做 agent 的思路融合二者又有不同,既相信模型又加入合理约束。在 agent 领域,MiniMax 虽无壁垒但有绝活,力求输出新认知,所以提前公布 Agent Team 及其架构。中国模型公司「开源」玩法不会长久,但优秀认知应及时分享。择因认为,当 agent 能自进化且效率和成本优于人类时,开发 agent 的工作可能停止,这一未来并不遥远。
对话探讨多方面问题
架构即认知:择因表示 Agent Team 提前发布是为传达认知,吸引核心用户,后续会考虑开源。MiniMax Code 反馈良好,用户用 Agent Team 做长视频生成等带来意外惊喜。个人爱好角度用 agent 做视频可行,专业制作需分工,模型能力提升会降低成本。架构设计基于让干活和验证 agent 分开的想法,内部使用效果好。睡前派任务,worker 和 verifier 可完成工作,公司出现新开发节奏。与传统编排相比,Agent Team 架构有复杂自由度限制,能灵活应对问题,解决「上下文焦虑」。靠提示词让 agent 实现对抗避免共谋,让用户自定义停止条件,M3 训练加入相关数据。agent 上下文隔离是为避免执行轨迹污染,多任务查询不「串台」靠 IM agent,未来可语音操作 agent。
没有壁垒,全是共识:Anthropic 认为模型危险可能是宣发倾向,不同框架效果不同,agent 和模型是长短板关系。Claude Code 新架构与 Agent Team 构思趋同,目前是合理方案,但细节决定胜负。Anthropic 可能有好东西未放出,harness 成共识后需等懂 harness 的新模型。多 agent 是热点,MiniMax 倾向人和 agent 有相同操作权限,加约束是为让模型工作更好。模型企业做 agent 是为契合模型能力、增加使用量。大家重视 agent,形成共识速度加快,OpenClaw 影响行业。模型公司走全模态路线、有自研模型并部署产品有优势,组织效率也很重要。MiniMax 要投入细节做差异化。模型能力强时,开源取决于团队偏好,未来开源风气可能变化。大厂做 agent 产品应闭环到模型训练,B 端产品收益更明确。
先交学费再上班:距离《Her》《钢铁侠》里的 agent 不远,只要模型多模态能力强,打开物理世界接口即可。基于 agent 能力自由、有规范和约束,工作形成闭环,员工更资深。agent 变强后,人类可享受便捷,做感兴趣的事。未来本科生可能「付费上班」成为资深员工,这在视频剪辑领域已出现,若 agent 能力超人类,公司可能不招初级员工,未来可能享受 AI 效率或教育制度创新。择因若掌握无限制算力,想用于推理,做每个人的分身,发现认知外的可能性,关注小概率颠覆性事件,更想知道认知内外的选择。
