当前位置：首页 > news >正文

别再只调API了！用SpringBoot+Session打造一个带记忆的ChatGPT对话服务

news 2026/7/1 9:03:01

用SpringBoot+Session打造带记忆的ChatGPT对话服务

在当今AI应用遍地开花的时代，单纯的单轮问答已经无法满足用户对智能交互的期待。想象一下，当你问"Java中的Stream有什么特点？"后接着问"那并行流呢？"，如果AI完全忘记了前文，这样的对话体验该有多糟糕。本文将带你用SpringBoot和HttpSession，为ChatGPT API调用添加"记忆"能力，打造真正连贯的多轮对话服务。

1. 为什么需要对话记忆？

传统的API调用方式每次都是独立的请求-响应，就像两个失忆的人在聊天。而人类对话的核心在于上下文关联——每一句话都建立在前文基础上。这种连续性对技术讨论、需求澄清等场景尤为重要。

以开发者问答为例：

用户：Spring Boot怎么配置多数据源？
AI：可以通过AbstractRoutingDataSource实现...
用户：那事务怎么管理？如果没有上下文，第二个问题就变成了无头苍蝇。

关键技术选择对比：

方案	优点	缺点	适用场景
前端存储	减轻服务端压力	安全性低，易丢失	简单POC
数据库存储	持久化可靠	增加IO开销	重要业务对话
Session存储	开发简单，自动过期	集群环境需处理	一般交互场景

HttpSession方案在开发效率与功能完整性间取得了最佳平衡，特别适合中小型应用快速实现上下文对话。

2. 核心架构设计

2.1 数据模型设计

OpenAI的ChatCompletion API要求messages参数按对话顺序排列，每个消息需标明角色（user/assistant）。我们的数据模型需要：

public class ChatMessage { private String role; // "user"或"assistant" private String content; // 省略构造器/getter/setter } public class ChatRequest { private String model; private List<ChatMessage> messages; // 完整的对话历史 }

注意：content字段应做好敏感词过滤，避免存储违规内容导致法律风险。

2.2 Session存储策略

在Service层实现对话历史管理：

public String handleChat(String userInput, HttpServletRequest request) { HttpSession session = request.getSession(); // 从session获取或初始化对话历史 List<ChatMessage> history = Optional.ofNullable( (List<ChatMessage>) session.getAttribute("chatHistory")) .orElse(new ArrayList<>()); // 添加用户新输入 history.add(new ChatMessage("user", userInput)); // 调用API并获取响应 ChatResponse response = callChatGPT(history); ChatMessage aiReply = parseResponse(response); // 保存AI回复到历史 history.add(aiReply); session.setAttribute("chatHistory", history); return aiReply.getContent(); }

关键点：

使用request.getSession()自动处理会话跟踪
对话历史以List形式保存，保持时序
每次交互都包含完整的上下文

3. 前后端协作实践

3.1 后端接口设计

RESTful接口需要支持两种操作：

提交新消息并获取回复
获取当前会话的完整历史

@RestController @RequestMapping("/api/chat") public class ChatController { @PostMapping public Response submitMessage(@RequestBody MessageDTO dto, HttpSession session) { // 处理消息并保存到session // 返回最新回复 } @GetMapping("/history") public Response getHistory(HttpSession session) { // 返回完整对话历史 } }

3.2 前端实现技巧

前端需要维护对话的显示状态，并与后端同步：

// 使用Vue示例 const chatState = reactive({ history: [], loading: false }) async function sendMessage() { chatState.loading = true; const response = await axios.post('/api/chat', { text: userInput.value }); // 刷新本地历史记录 const {data} = await axios.get('/api/chat/history'); chatState.history = data; chatState.loading = false; }

提示：对于长对话，前端可以实现分页加载历史记录，避免一次性渲染大量内容。

4. 进阶优化与生产考量

4.1 性能优化策略

当对话历史增长时，需要注意：

设置历史记录最大长度（如最近10轮）
定期清理长时间闲置的会话
对大模型响应进行流式传输

// 限制历史记录长度 if(history.size() > MAX_HISTORY) { history = history.subList( history.size() - MAX_HISTORY, history.size()); }

4.2 分布式环境解决方案

在集群部署时，默认的Session机制会失效，需要采用：

Spring Session + Redis：

<dependency> <groupId>org.springframework.session</groupId> <artifactId>spring-session-data-redis</artifactId> </dependency>

配置示例：

spring: session: store-type: redis timeout: 1800 # 30分钟过期 redis: host: redis-cluster.example.com

4.3 安全防护措施

必须考虑的安全问题：

设置合理的Session过期时间
对用户输入进行内容审查
限制单个用户的并发请求数

可在拦截器中实现基础防护：

@Interceptor public class RateLimitInterceptor implements HandlerInterceptor { private final RateLimiter limiter = RateLimiter.create(5.0); // 5QPS @Override public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) { if(!limiter.tryAcquire()) { throw new RateLimitException(); } return true; } }

5. 替代方案深度对比

当业务规模扩大后，可能需要更专业的解决方案：

会话存储方案对比表：

特性	HttpSession	Redis存储	专业对话数据库
开发难度	⭐️	⭐️⭐️	⭐️⭐️⭐️⭐️
扩展性	⭐️	⭐️⭐️⭐️⭐️	⭐️⭐️⭐️⭐️⭐️
持久化能力	⭐️	⭐️⭐️⭐️	⭐️⭐️⭐️⭐️⭐️
成本	免费	中等	较高
适合阶段	MVP	成长阶段	成熟产品