当前位置: 首页 > news >正文

零 Token 消耗!Agnes 多模态 Agent 全栈实战指南

文生图 · 文生视频 · 智能 Agent 一站式接入,真正让 AI 落地工作流

前言:我为什么开始用 Agnes?

在折腾了一堆 AI 工具之后,我最大的痛点不是模型效果,而是——每次调用都在烧钱。输入 token、输出 token,还有各种隐性计费,一个稍微复杂点的 Agent 工作流跑下来,账单看得人心疼。

直到我发现了 Agnes,才算找到了真正能「无感」使用的 AI 平台。本文不是硬广,是我实际配置并跑通了图像生成、视频生成、多轮 Agent 对话之后,把整套流程整理出来分享给大家。如果你也在找一套零 token 消耗、功能完整的多模态 AI 解决方案,这篇可以直接当手册用。

一、Agnes 平台概览:三大核心模型

Agnes 目前对外提供三个主力模型,覆盖了日常 AI 工作流的主要场景:

  • Agnes2.0 Flash —— 智能 Agent 模型,支持工具调用、多轮对话、自定义知识库,适合构建自动化工作流
  • Agnes-Image-2.1-Flash —— 图像生成模型,文生图效果出色,支持风格定制,出图速度快
  • Agnes-Video-V2.0 —— 视频生成模型,支持文生视频,适合内容创作、产品演示等场景

💡重点:Agnes 平台的模型调用不消耗用户的 token 配额,按实际 API 请求计费,对于高频场景尤其友好。

二、注册账号并获取 API Key

整个接入流程非常标准,跟 OpenAI 的操作逻辑基本一致,熟悉的同学五分钟内可以跑通。

2.1 创建 API 密钥

登录 Agnes 平台后,进入「设置 → API 密钥」页面,点击「创建新的密钥」,为密钥命名(比如 test_01),保存后复制备用。

图1:Agnes 平台 API 密钥管理页面

注意密钥只在创建时完整显示一次,务必即时保存。后续列表中只展示前缀和后缀(如 sk-m9b5I...9Aobph)。

2.2 接口地址

Agnes 提供兼容 OpenAI 协议的 API,接口地址格式为:

https://api.agnes-ai.com/v1/chat/completions

三、将 Agnes 模型接入 WorkBuddy(以自定义模型为例)

Agnes 支持通过任何兼容 OpenAI 协议的客户端接入。下面以 WorkBuddy 为例,演示完整的配置流程。WorkBuddy 是目前体验较好的 AI 工作台之一,支持多模型切换、技能调用、Agent 工作流等功能。

3.1 打开「添加模型」配置弹窗

在 WorkBuddy 主界面底部工具栏,点击模型选择器 → 展开列表后,找到「+ 配置自定义模型」入口(见下图红色箭头标注)。

图2:WorkBuddy 模型选择器,底部有「+ 配置自定义模型」入口

3.2 填写配置信息

在弹出的「添加模型」对话框中,按如下内容填写各字段:

  • 提供商:选择「自定义 / Custom」
  • 接口地址:填入 Agnes API 地址
  • API Key:粘贴第二步中保存的密钥
  • 模型名称:根据需要填写,例如 agnes2-flash 或 agnes-image-2.1-flash

图3:WorkBuddy 添加自定义模型配置弹窗

高级配置中,建议勾选「工具调用」和「图片输入」,这样 Agnes2.0 Flash 的 Agent 能力和多模态输入都能正常使用。配置完成后点击「保存」即可。

四、实战一:Agnes-Image-2.1-Flash 文生图

Agnes 图像模型支持自然语言描述直接出图,接入 WorkBuddy 后,可以通过技能(Skill)调用的方式触发图像生成。

4.1 在 WorkBuddy 中触发图像生成

配置完成后,在对话框中使用 @agnes-image-api 技能,直接用中文描述你想要的画面,模型会自动理解并生成。

图4:WorkBuddy 中调用 agnes-image-api 技能,用自然语言生成图像

如上图,输入「我要猫咪在海边散步图片」,系统触发工具调用,Agnes-Image-2.1-Flash 完成图像生成。整个过程不需要编写任何 Prompt 模板。

4.2 生成效果示例

以下是 Agnes-Image-2.1-Flash 实际输出的图像效果(提示词:猫咪在海边散步,黄昏光线,写实风格):

图5:Agnes-Image-2.1-Flash 生成效果 —— 猫咪海边散步

画面细节丰富,光线处理自然,毛发质感和背景的海浪、贝壳都有较高的真实感,适合内容创作、社媒配图等场景。

五、实战二:Agnes2.0 Flash Agent 能力

Agnes2.0 Flash 的核心优势在于 Agent 工作流:支持多步骤工具调用、联网搜索、文件处理、自定义知识库等能力,适合构建自动化流程。

5.1 API 调用示例(Python)

下面是一个简单的 Python 示例,展示如何通过 API 调用 Agnes2.0 Flash 进行多轮对话:

import openai client = openai.OpenAI( api_key="sk-your-agnes-api-key", base_url="https://api.agnes-ai.com/v1" ) response = client.chat.completions.create( model="agnes2-flash", messages=[ {"role": "system", "content": "你是一个专业的数据分析助手"}, {"role": "user", "content": "请帮我分析这份销售数据的趋势"} ] ) print(response.choices[0].message.content)

💡Agnes2.0 Flash 完全兼容 OpenAI SDK,存量代码只需替换 api_key 和 base_url 两个参数,迁移成本极低。

5.2 工具调用(Function Calling)

Agnes2.0 Flash 支持标准的 tools 参数格式,可以接入自定义函数、数据库查询、外部 API 等工具。以下是定义工具的示例结构:

tools = [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的实时天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名称"} }, "required": ["city"] } } } ]

六、实战三:Agnes-Video-V2.0 文生视频

视频生成是 Agnes 平台近期推出的重量级功能。Agnes-Video-V2.0 支持通过文字描述直接生成短视频,适用于:

  • 产品功能演示视频
  • 社交媒体短视频内容
  • 教学/说明类动态图解
  • 创意广告素材生成

接入方式与图像模型相同,在 WorkBuddy 中配置模型名称为 agnes-video-v2 即可,或通过 API 直接调用:

response = client.chat.completions.create( model="agnes-video-v2", messages=[ {"role": "user", "content": "生成一段5秒的产品展示视频,科技感蓝色背景,3D旋转logo"} ] )

七、关于计费:不消耗 token 是什么意思?

很多同学对「不消耗 token」有疑惑,这里解释一下:

Agnes 平台的计费单位是 API 调用次数 / 请求量,而非按输入输出 token 数量计费。这意味着:

  • 无论你的输入内容有多长,不会因为「token超出」而产生额外费用
  • Agent 多轮对话中的上下文不会随着对话变长而指数级增加成本
  • 批量处理任务时,费用预估更稳定、更可控

💡对于需要频繁调用 AI 的自动化工作流来说,这种计费方式可以显著降低成本不确定性,便于做预算规划。

八、总结

折腾完这一套下来,Agnes 给我最大的感受是「接入成本低、功能覆盖全、计费逻辑清晰」。三个模型分工明确:

  • Agnes2.0 Flash:日常 Agent 任务、自动化工作流首选
  • Agnes-Image-2.1-Flash:快速出图、内容创作
  • Agnes-Video-V2.0:短视频素材生成

如果你正在搭建自己的 AI 工具链,或者想把 AI 能力嵌入到现有业务系统里,Agnes 是值得认真评估的选项。

有问题欢迎评论区交流,我会尽量回复。

— 本文仅供技术参考,如有更新请以官方文档为准 —

http://www.cnnetsun.cn/news/2719959.html

相关文章:

  • 如何高效使用冒险岛资源解析工具:5个实用技巧全面指南
  • PyTorch项目安装报错libcupti.so.12找不到?一个软链接搞定CUDA环境依赖
  • 别再死记公式了!用Simulink仿真带你直观理解Buck电路的DCM与CCM模式切换
  • GEO优化技术实现全流程拆解:中小企业如何让AI大模型准确收录你的信息
  • 深度实战:高效掌握GroundingDINO零样本目标检测的核心功能与进阶技巧
  • 2026年6月6款设计AI采购建议
  • 从Taker到Maker:我的Crypto做市策略如何靠一个‘Bug’意外盈利?
  • 告别呆板烟雾!在Niagara里用SubUV和随机旋转/缩放打造更自然的飘散效果
  • Nerfstudio训练速度慢?渲染效果差?可能是你忽略了这5个关键参数(附性能对比实测)
  • 嵌入式调试新思路:不写代码,用Ozone的J-Link数据采样功能“看”变量变化
  • 364张外周血涂片图:WBC/RBC/血小板YOLO格式标注数据,含train/val/test划分及完整配置
  • OpenClaw从入门到应用——CLI:Daemon
  • 亚西亚眠尔康片:褪黑素+酸枣仁双成份协力助眠,“蓝帽“认证成为千万人睡眠新选择
  • STM32调试效率翻倍:除了printf,你的串口还能这样‘打印’数据和图形
  • 联想电脑F11一键恢复丢了别慌!手把手教你用官方工具找回原厂正版系统(含Office)
  • 告别卡顿!优化QEMU运行Win10 ARM性能的5个关键设置(实测有效)
  • 2026年 Go 开发中没有它就不行的8个库
  • 105.跨品牌 Android 自动化刷机工具,支持小米 / 华为 / OPPO/vivo
  • Unlock-Music:免费浏览器音乐解锁工具终极指南
  • 告别显示器!用VNC Viewer无线连接树莓派5的保姆级教程(含静态IP设置)
  • VSCode写C#不止Code Runner:深度配置C#扩展,解锁智能提示与调试完整能力
  • Linux iptables 深度解析:从规则匹配到 NAT 转发实战
  • 115网盘原生播放:如何通过Kodi插件实现云端流媒体直通车
  • 最大优势: 知道怎么活下去的底线成本,底线以上就是财富自由,富二代的人最大的劣势就是回不去吃苦的时候 ,而你体验过且能再回去
  • 2026年求职者必看:5 个 Word 简历模板网站实测,可直接编辑
  • 魔兽争霸3终极帧率优化指南:使用WarcraftHelper解锁流畅游戏体验
  • ZYNQ开发避坑指南:手把手教你解决PS与DDR通信的Cache一致性问题
  • 别再手动改代码了!用Gem5调试片上网络(NoC)的保姆级实战指南(附脚本)
  • 死锁与进程资源分配问题的解法
  • 12V输入双路输出电源板:5V用7805、3.3V用AMS1117,含可编辑Altium原理图与PCB