当前位置: 首页 > news >正文

Agent 市场血雨腥风,MiniMax 多 Agent 架构引领变革,重塑行业格局?

Agent 市场竞争激烈,MiniMax 搅动风云

Agent 的世界,四月山雨欲来,五月血雨腥风,行业加速迅猛。Vibe Coding 不再新鲜,编程赛道拥挤,Claude Code、Codex 等贴身肉搏,黑话流行,去年 skill 当道,如今 harness 称王。热词之下,Opus、GPT 等模型在写代码和执行复杂任务上表现出色,但拉开模型公司差距的是外面的壳。研究报告显示,Claude Code 泄露代码中仅 1.6% 为模型决策代码,98.4% 是 harness。全新一代 agent 产品涌现,Grok Build 等纷纷推出,DeepSeek 也在招人组建 agent 开发队伍。早布局 agent 的 MiniMax 在 5 月中旬桌面端推出 Agent Team 功能,随 M3 旗舰模型发布,桌面端升级为 MiniMax Code,搅动 agent 市场。

Agent Team 架构特色及 MiniMax 思路

Agent Team 内核是 Leader - Worker - Verifier 的「对抗式」架构,干活和挑错职责分离,受状态机管理,上下文隔离,专治长程 agent 任务顽疾。MiniMax 未等 M3 先在 M2.7 推出 Agent Team,M2 被称为「大巧若拙」,M3 会更强。训练 M3 关键时期,APPSO 与 MiniMax Agent 研发工程师择因对谈,探讨 Agent Team 设计原则等。业界认为 Anthropic 有好模型但工程差,其不信任模型,处处约束;OpenAI 的 harness 极简,不同框架效果不同。MiniMax 做 agent 的思路融合二者又有不同,既相信模型又加入合理约束。在 agent 领域,MiniMax 虽无壁垒但有绝活,力求输出新认知,所以提前公布 Agent Team 及其架构。中国模型公司「开源」玩法不会长久,但优秀认知应及时分享。择因认为,当 agent 能自进化且效率和成本优于人类时,开发 agent 的工作可能停止,这一未来并不遥远。

对话探讨多方面问题

架构即认知:择因表示 Agent Team 提前发布是为传达认知,吸引核心用户,后续会考虑开源。MiniMax Code 反馈良好,用户用 Agent Team 做长视频生成等带来意外惊喜。个人爱好角度用 agent 做视频可行,专业制作需分工,模型能力提升会降低成本。架构设计基于让干活和验证 agent 分开的想法,内部使用效果好。睡前派任务,worker 和 verifier 可完成工作,公司出现新开发节奏。与传统编排相比,Agent Team 架构有复杂自由度限制,能灵活应对问题,解决「上下文焦虑」。靠提示词让 agent 实现对抗避免共谋,让用户自定义停止条件,M3 训练加入相关数据。agent 上下文隔离是为避免执行轨迹污染,多任务查询不「串台」靠 IM agent,未来可语音操作 agent。

没有壁垒,全是共识:Anthropic 认为模型危险可能是宣发倾向,不同框架效果不同,agent 和模型是长短板关系。Claude Code 新架构与 Agent Team 构思趋同,目前是合理方案,但细节决定胜负。Anthropic 可能有好东西未放出,harness 成共识后需等懂 harness 的新模型。多 agent 是热点,MiniMax 倾向人和 agent 有相同操作权限,加约束是为让模型工作更好。模型企业做 agent 是为契合模型能力、增加使用量。大家重视 agent,形成共识速度加快,OpenClaw 影响行业。模型公司走全模态路线、有自研模型并部署产品有优势,组织效率也很重要。MiniMax 要投入细节做差异化。模型能力强时,开源取决于团队偏好,未来开源风气可能变化。大厂做 agent 产品应闭环到模型训练,B 端产品收益更明确。

先交学费再上班:距离《Her》《钢铁侠》里的 agent 不远,只要模型多模态能力强,打开物理世界接口即可。基于 agent 能力自由、有规范和约束,工作形成闭环,员工更资深。agent 变强后,人类可享受便捷,做感兴趣的事。未来本科生可能「付费上班」成为资深员工,这在视频剪辑领域已出现,若 agent 能力超人类,公司可能不招初级员工,未来可能享受 AI 效率或教育制度创新。择因若掌握无限制算力,想用于推理,做每个人的分身,发现认知外的可能性,关注小概率颠覆性事件,更想知道认知内外的选择。

http://www.cnnetsun.cn/news/2833096.html

相关文章:

  • 腾讯会议同传工具评测与选型指南
  • DDD-018:应用服务与事务脚本
  • 103、飞控仿真环境搭建:Gazebo与PX4 SITL
  • 【Ubuntu】使用ffmpeg解析m3u8网页视频
  • 7大真实任务实测 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max
  • Spring依赖注入的方式
  • Gemini 3.5 深度实测|碾压前代!多模态+工程协作落地,重新定义AI开发辅助上限
  • 深度解析飞算 JavaAI 智能引导的五大步骤:AI 是如何把一句需求变成工程级 Java 代码的?
  • 洛雪音乐音源配置终极指南:从零搭建专业级音乐库的完整方案
  • 网规笔记真题解析:2024年11月软考网规案例分析
  • 如何让机器人在未知环境中实时构建3D地图?RTAB-Map技术深度解析
  • MyBatis-Plus 性能分析实战
  • nmap:网络扫描祖师爷,二十多年过去还是没对手
  • HsMod:炉石传说玩家的全能工具箱,55项功能重新定义游戏体验
  • ArduPilot自动驾驶系统核心技术架构深度解析
  • 基于S32K144的PMSM无感FOC实战:从原理到MCAT调试全解析
  • Layerscape FTM定时器级联:突破16位限制实现长周期高精度计时
  • 鸣潮智能助手终极指南:3步解放你的游戏时间
  • 光学微操纵用HE11波导与SPP倏逝场光力交互计算工具包
  • 解决: Error while loading conda entry point: anaconda-cloud-auth (No module named ‘typing_extensions‘)
  • connecthomeip/matter 属性读全流程
  • 洛雪音乐音源终极指南:如何构建稳定高效的音乐播放器架构
  • 让电子课本从云端走到桌面:你的个人教学资源管家
  • Adobe Illustrator脚本终极指南:20个免费工具提升设计效率10倍
  • Python与AutoCAD的完美融合:pyautocad如何让CAD编程效率飙升500%
  • 【Gabor神经网络(GNN)】级联多尺度 Gabor 分解架构
  • 轻量级跨语言手写检索技术解析与应用实践
  • 口述编程实战:5分钟从零写出批量文件重命名工具(vibe-coding第一次实操)
  • 告别十六进制编辑:3步掌握暗黑破坏神2可视化存档编辑器
  • 5分钟永久备份QQ空间:GetQzonehistory让你的青春记忆永不丢失