当前位置: 首页 > news >正文

字节新论文:通过Context-Folding记忆折叠实现复杂Agent

摘要

今天一起看下字节新出论文《Scaling Long-Horizon LLM Agent via Context-Folding》。
在构建长程(Long-Horizon)Agent 时,上下文窗口的线性增长与注意力的二次方开销是制约模型推理能力与运行效率的核心瓶颈。不同于传统的 RAG 或基于摘要的被动压缩,字节提出的Context-Folding 赋予了 Agent主动管理记忆的能力:通过branchreturn原语,Agent 可以动态开辟分支处理子任务,并在任务完成后将过程“折叠”,仅保留核心摘要返回主线程。本文将从架构设计、FoldGRPO 训练算法及工程实现细节三个维度尝试解构这一方案。


1. 引言:Agent 的记忆痛点

随着 Agent 能够处理的任务越来越复杂(如 SWE-Bench 上的代码工程或 Deep Research),其交互轨迹(Trajectory)呈指数级增长。传统的 ReAct 架构采用“线性累积”策略,将所有 Reasoning、Tool Call 和 Observation 堆叠在 Context 中。

这种做法面临两个物理铁律的挑战:

  1. Lost-in-the-Middle:即便 Contex
http://www.cnnetsun.cn/news/96540.html

相关文章:

  • LinkedIn职业建议:LobeChat撰写个人简介
  • 9 个 MBA 论文降AI工具,AI 写作优化推荐
  • 10 个高效降AI率工具,自考党必备!
  • 测试技术如何应用于股市个股的风险评测?
  • Java毕设选题推荐:基于java的畅销图书推荐系统基于springboot+vue的畅销图书推荐系统的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 计算机Java毕设实战-基于JavaWeb的智慧养老院管理系统的设计与实现访客记录、病历档案、入院指南、药品信息【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 计算机Java毕设实战-基于JavaWeb的心聘求职平台的设计与实现基于springboot的人才求职招聘平台设计与实现【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • LobeChat会议议程自动生成器开发
  • Python面向对象——进阶(三)
  • C语言实现图书管理系统[2025-12-17]
  • LobeChat对话摘要自动生成实践
  • 迈向价值透明:基于意义行为原生论的机器学习治理框架——一份人机协作的独立宣言
  • 企业级AI客服新选择:基于LobeChat镜像的智能对话系统搭建
  • LobeChat会员等级权益设计建议
  • LobeChat版本更新日志解读:v0.8.5新增特性一览
  • LobeChat RBAC权限模型设计
  • LobeChat董事会汇报PPT内容生成
  • 8个AI写作工具,专科生轻松搞定论文格式规范!
  • 使用 Python 动手实践全局优化方法
  • 如图,红框是新版QQ,右边是旧版QQ
  • LobeChat差分隐私保护机制设计
  • 《gdb 与 cgdb 深度解析:命令行调试的效率革命》
  • 国产时序数据库崛起:金仓凭什么在复杂场景中碾压InfluxDB
  • 脚本网页 地球演化
  • AXI-A7.4.9 Atomic transaction dependencies
  • 【AI黑科技】6.89%性能炸裂!ASFR框架让知识图谱“开天眼“,小白程序员也能玩转大模型增强技术
  • Google最新AI Agents课程全解析!337页白皮书浓缩精华,从入门到精通,手把手教你成为Agent开发大神!
  • 介观交通流仿真软件:Aimsun Next_(10).动态交通分配
  • C语言学习第四天
  • 通信工程毕设易上手课题指导