当前位置: 首页 > news >正文

AI编程Token成本将与开发者薪资持平,企业如何应对?

企业很快就可能在开发者AI Token使用上的支出,与支付给他们的薪资不相上下。

根据Gartner的研究,这一成本将在未来两年内达到甚至超过软件工程师的月均薪资水平。

这一趋势的形成,不仅因为开发者正越来越多地采用生成式AI与智能体工具,也反映出供应商在平衡基础设施投入与盈利能力时,正逐步转向基于消费量的授权模式。过去那种按席位付费的SaaS固定收费方式已成历史,如今企业还需为开发者的Token用量额外买单。

Gartner高级首席分析师Nitish Tyagi解释称,Gartner的预测基于全球月均薪资2000美元的平均水平,并非意指AI Token消耗将超过所有岗位的薪资。例如,美国开发者的年薪往往达到六位数甚至更高。

不过,Tyagi强调,这种量级的支出并非遥不可及。"我曾听到过令人担忧的数字,比如'我的开发者上个月消耗了2万美元',或者'一位业务用户消耗了3.2万美元'。"

这些数字之所以令人震惊,正是出于警示目的。他表示:"这是为了警示行业,如果Token成本不加以管控,将会带来严重影响。"

Tyagi指出,企业正迅速从AI试验阶段转向大规模部署AI编程智能体,但许多企业仍低估了Token成本。原因在于,软件工程工作负载的成本结构"极具变动性",而Token消耗的计算与计费方式缺乏足够的透明度。

他表示,AI编程供应商尚未提供"成熟的内置成本优化能力",而随着供应商持续扩展模型能力并维持盈利需求,价格可能还会进一步上涨。

因此,企业在成本预测与控制方面面临重重困难。由于AI发展速度极快,许多组织缺乏判断投资回报率所需的"成熟度与评估框架"。智能体驱动的工作流程难以治理,上下文窗口不断膨胀,预算提前耗尽,Token支出的合理性也愈发难以证明。

此外,非开发者等轻度用户随着对AI工具的熟悉程度加深,乃至产生依赖,其使用量也将不断增加,进一步推高Token消耗与支出。

Tyagi表示,尽管AI价值巨大,但他并未看到开发者消耗的Token数量与其生产力提升之间存在"直接关联"。相反,运用上下文工程原则来优化或减少Token消耗,才能切实提升质量。

"大量消耗Token与更高的生产力并不直接挂钩,但优化Token消耗却可以做到这一点。"Tyagi说。

不过,这绝不意味着企业应该放弃AI编程智能体。优化Token消耗,只是意味着在不影响AI所带来的质量与价值的前提下,按需使用。

"如果没有受治理约束的工程运营模式,成本的增速可能会超过这些工具本应带来的生产力提升。"Tyagi说。

当AI几乎能瞬间生成整个Python库时,传统的"代码行数"生产力指标已不再适用。Tyagi认为,应转而以质量、交付速度和用户满意度等指标来衡量价值。

例如:开发者能以多快的速度交付重要功能?从应用开发到业务、产品和开发团队反馈之间的周期压缩了多少?他表示,在保证质量的前提下快速交付功能,能够形成竞争优势,并提升用户与客户体验。

Gartner还建议企业建立完善的治理机制与成本管控措施,例如设定Token使用上限、自动化监控用量,并建立明确的超额预警机制。

该机构指出:"将这些管控措施嵌入工程工作流程,有助于保持一致性,防止成本失控增长。"

此外,企业应建立"场景驱动"的决策框架,明确界定AI编程智能体的适用场景,以及在特定任务中应赋予其的自主程度。同时,将任务划分为三种执行模式:"开发者主导"、"开发者协同智能体"以及"完全智能体主导"。

Gartner还建议企业根据任务复杂度选择合适的模型,将工作拆解为可由较小模型处理的子任务,"仅在复杂度确有需要时才向上升级"。工程团队应有意识地规划工作流路由,将简单、高频任务交由小模型处理,仅将前沿模型用于复杂及高价值工作。

另一项降本策略是强制推行上下文工程规范。企业应培训开发者优化输入给AI的上下文信息,仅纳入相关内容,尽量对内容进行摘要,并剔除冗余数据。

此外,团队还应将Token用量审查纳入开发周期,定期审视高Token消耗的工作流,有助于发现效率瓶颈、优化实践并促进协作。

Tyagi指出,开发者通常倾向于追求速度与便利,而非成本效率,因此Token管控不能单靠开发者自律来实现。

他对领导层的建议是:不要将AI编程成本的上涨视为放弃AI、或将所有工作转向开源生成式AI模型的理由。"目标始终是在不损害价值的前提下优化成本。"

他建议从小处入手,优先关注上下文工程。评估当前软件工程的成熟度,选择合适的智能体自主程度。AI辅助开发最高可带来20%的生产力提升,"这已经是相当不错的数字了"。

对于开发者,他建议:"将上下文工程作为最重要的个人技能来修炼。这不仅对你的雇主有益,对你的职业发展同样如此。"

Q&A

Q1:AI编程的Token成本为什么会快速上涨,涨到什么程度?

A:根据Gartner预测,企业在开发者AI Token使用上的支出,将在未来两年内达到甚至超过软件工程师的月均薪资(以全球月均2000美元为基准)。成本上涨的原因包括:生成式AI和智能体工具的广泛采用、供应商从固定席位授权转向消费量计费模式,以及供应商持续扩展模型能力推高定价等。

Q2:企业应该怎么控制AI编程的Token费用?

A:Gartner建议企业从多个层面入手:一是建立治理机制,设定Token使用上限、自动监控用量并设立超额预警;二是构建场景驱动的决策框架,明确什么任务用什么模型,简单任务用小模型,复杂任务才动用前沿大模型;三是强制推行上下文工程规范,让开发者学会精简输入信息;四是将Token用量审查纳入常规开发周期,定期优化高消耗流程。

Q3:Token消耗越多,开发者生产力就越高吗?

A:并非如此。Gartner分析师Tyagi明确指出,Token消耗量与生产力提升之间并不存在直接关联。一味追求大量Token消耗(即"Tokenmaxxing")并不能带来更高效率,真正有效的做法是通过上下文工程优化Token的使用质量,在不影响AI输出价值的前提下减少不必要的消耗,从而实现成本与效率的双重提升。

http://www.cnnetsun.cn/news/3076078.html

相关文章:

  • 报错解决org.springframework.web.method.annotation Failed to convert value of type ‘java.lang.String‘ to
  • ESP32 + 传感器:手把手教你做土壤监测终端
  • 微信小程序:农户手机上的「农场管家」
  • 自动灌溉系统:AI 什么时候浇水,比老农还准?
  • 批量处理远程共享目录中的特定类型文件(如 .hex、.csv 等)。
  • OpenGL学习笔记-05-着色器-数据类型/输入输出/uniform
  • 基于OpenCV与YOLO的实时目标检测系统搭建指南
  • Docker部署PostgreSQL
  • Playwright混沌工程实战:构建AI增强的韧性Web自动化测试体系
  • 【LeetCode】反转字符串
  • 京东开源实时视频视觉语言交互模型:全栈方案解析与落地实践
  • 智能体颠覆安全-360图龙锋如何用蜂群路线打造中国版Mythos
  • Java 26 发布了, 我人麻了。。
  • 玩三角洲要高配?2026年这5款旗舰游戏本让你杀穿新赛季
  • AI模型门控发布机制解析:原理、实践与行业应用
  • 2026全球EMBA客观测评:科学选型与优质项目解析
  • 工程师转型AI:从跑通Demo到收藏实战秘籍,拒绝高数劝退!
  • 微信聊天记录备份终极指南:如何安全保护你的数字记忆
  • UMDF驱动开发入门:二 详解INF文件与设备类选择
  • 软件测试——黑盒测试
  • AI Agent 三种记忆的工程落地
  • 网络安全事件报告——伪CAPTCHA诱骗用户运行危险的PowerShell脚本
  • 小白可懂的保姆级 Redis 教程
  • ponytail爆火:专治AI编程过度造轮子,代码直接砍半
  • 解密 MCP:开启 AI 与数据交互的新标准
  • 新课标下,小学数学最需要的能力不是“算得快“,而是“想得通“
  • 深入认识ClassLoader - 一次投产失败的复盘
  • DeepSeek美化-为 DeepSeek 网页版引入 Obsidian Border 主题视觉风格
  • RAG基础
  • 做智驾十年,为何Momenta上市换锚?