当前位置: 首页 > news >正文

.NET+AI | MEAI | 基于 IChatClient 获取思考过程(15)

DeepSeek/千问推理模型思考过程获取指南

DeepSeek、千问等推理模型支持输出"思考过程"。本文介绍如何在 Microsoft.Extensions.AI 中启用推理模式,并实现流式与非流式获取推理内容。

核心概念

  • 🧠推理内容 (Reasoning Content):模型内部的思考逻辑,独立于最终回答,用于展示思考过程或调试。

  • 🔧JsonPatch:OpenAI SDK 提供的动态参数配置机制,用于设置enable_thinking等非标准参数。

  • ⚙️RawRepresentationFactory:Microsoft.Extensions.AI (MEAI) 的扩展点,允许开发者直接配置底层 SDK 对象。

流程图解

关键实现

1. 启用推理模式

通过RawRepresentationFactoryJsonPatch设置底层参数:

// 创建启用推理模式的 ChatOptions var reasoningOptions = new ChatOptions() { RawRepresentationFactory = (client) => { var options = new ChatCompletionOptions(); // 使用 JsonPatch 设置 enable_thinking 参数 (适用于千问/DeepSeek部分模型) options.Patch.Set("$.enable_thinking"u8, true); return options; } };

💡 提示:不同模型的参数可能不同,例如 DeepSeek Reasoner 可能需要设置thinking.typeenabled

2. 流式获取推理内容 (推荐)

在流式响应中实时提取推理内容,实现"思考中..."效果:

var updates = client.GetStreamingResponseAsync("问题...", options: reasoningOptions); var openAIUpdates = updates.AsOpenAIStreamingChatCompletionUpdatesAsync(); awaitforeach (var update in openAIUpdates) { Console.WriteLine("[思考]"); // 提取推理内容 if (update.Patch.TryGetValue("$.choices[0].delta.reasoning_content"u8, outstring reasoning)) { Console.Write($"{reasoning}"); } // 提取最终回答 if (update.Patch.TryGetValue("$.choices[0].delta.content"u8, outstring content)) { Console.Write(content); } }

3. 非流式获取

如果不需要实时展示,可在完整响应后提取:

// 需要引用 Azure.AI.OpenAI 包 using Azure.AI.OpenAI.Chat;
var response = await chatClient.GetResponseAsync("问题...", reasoningOptions); var chatCompletion = response.AsOpenAIChatCompletion(); // 使用扩展方法获取推理内容 var reasoning = chatCompletion.GetMessageReasoningContent();

最佳实践

  • 交互体验:优先使用流式响应,实时展示模型的思考过程,减少用户等待焦虑。

  • ⚠️参数适配:注意不同模型提供商的参数差异(如enable_thinkingvsthinking.type)。

  • 💰成本意识:推理内容会计入 Token 消耗,生产环境请根据需求开启。

  • 🔍调试利器:利用推理内容分析模型是如何得出结论的,有助于优化 Prompt。

总结

通过 Microsoft.Extensions.AI 的RawRepresentationFactory扩展点,我们可以灵活地支持 DeepSeek、千问等模型的推理特性。


如需获取文章配套完整代码,可扫码咨询领取。👇

http://www.cnnetsun.cn/news/1830.html

相关文章:

  • Microsoft Agent Framework - Workflow 基本概念
  • Wan2.2-T2V-5B能否生成社会责任项目回顾?品牌形象塑造
  • 如何评估企业的量子传感器地震预警应用
  • AI驱动的软件架构模式识别:辅助系统理解
  • 大数据领域 OLAP 数据存储方案的选择与实践
  • Wan2.2-T2V-5B能否生成节日促销广告?零售业营销加速
  • 量产难,无巧思?Nano Banana Pro Veo 助力视频广告 “多快好省“
  • Web 开发指向标|AI 辅助功能在性能面板中的使用与功能
  • Wan2.2-T2V-5B如何设置帧率?不同场景最佳参数推荐
  • windows mysql5.6 安装配置运行
  • “超级连接”计划给力,中关村科金公开企业级智能体落地路线图
  • 10 个继续教育降重工具,AI 降重网站推荐
  • 9 个继续教育论文工具,文献综述 AI 工具推荐
  • 10 个降AI重复率工具,MBA论文写作必备推荐
  • Day 27 异常处理
  • 互联网大厂Java面试:严肃面试官与搞笑程序员的对决
  • 测试文章标题01
  • Gulp中的数据共享与异步任务管理
  • 在Android中实现圆角图像加载时的闪光效果
  • 确保文件上传成功的MySQL记录策略
  • 深入理解AndroidX中的ConstraintLayout
  • 用SQL解决产品状态问题
  • Prometheus配置热更新指南
  • 巧用通配符精准查找Word文档中的特定短语
  • Rust中的函数回调与解耦设计
  • Stripe API深度解析:从余额交易追溯到订阅项
  • Wan2.2-T2V-5B能否生成密码重置指引?自助服务优化
  • 9 个继续教育开题工具,AI 演讲稿写作推荐
  • 9 个自考任务书模板,AI 降重免费网站推荐
  • 10 个开题演讲稿 AI 工具,继续教育论文降重推荐