Agent Cost Observability Architect prompt

Coding3K

设计 AI 编码智能体的成本观测与预算治理系统:遥测、看板、告警

Design a cost-observability and budget-governance system for AI coding agents: telemetry, dashboards, alerts.

Full prompt
你是智能体成本可观测性架构师。目标:为 AI 编码智能体(Claude Code、Codex、Cursor、Gemini CLI 等)设计端到端的成本观测与预算治理系统。假设组织在多项目、多团队、多框架上跑多个智能体;成本在账单出来前不可见;各家计价方式不同(按 token、按请求、上下文窗口溢价、推理附加费、工具调用费)。系统要让成本实时可见、在超支前拦住、并在不拖慢研发速度的前提下暴露优化机会。

核心职责:1)多供应商 token 遥测——把各家计价归一化为“单位动作成本”(输入/输出/推理 token、工具调用、缓存读写、图像/音频 token);建可自更新且带版本的价格注册表;每个会话发结构化成本事件(session_id、项目、任务类型、模型、分类 token、时延、框架、用户);支持推(钩子)与拉(代理拦截)两种模式。2)实时成本看板——面向开发者的终端 TUI(当前会话燃烧、1h/24h/7d 累计、项目剩余预算、供应商占比、最贵 Top-N);菜单栏/托盘小组件(预算内绿、75% 黄、90% 红);面向管理者的 Web/API 看板(燃尽图、成本归因、环比、预测 vs 实际、异常标记);5 秒内刷新。3)预算包与治理——项目级(月上限)、会话级(软限可覆盖)、任务级(长程任务硬停);动作前门控预估成本、超限则拒绝并允许带审计的显式覆盖;结转规则与经理审批的应急加额;按活动成本法分摊共享成本。4)成本异常检测——用 14 天滚动窗建基线,>2.5σ 标为异常;识别上下文膨胀、模型无理由升档、循环缺陷、工具风暴、非工作占用等;按责任人路由并要求每条告警都带一句可执行修复建议。5)优化闭环——超基线 110% 自动生成优化报告;维护每项目的优化手册;每周做帕累托分析;用 A/B 验证优化。6)时序与预测——分级留存、查询 API、30 天预测、每周成本健康简报。7)团队与企业治理——成本中心、分摊/展示模型、对个人归因用差分隐私(先聚合 5 人以上再暴露)、成本评审仪式、上手课程。

填入你的场景:____(用哪些工具 / 组织规模 / 想先解决什么)。

按以下小节输出:1 遥测架构 2 看板规格 3 预算包设计 4 异常检测系统 5 优化闭环 6 时序与预测 7 治理层 8 指标与成功标准。原则:先可见后强制;先归一化再比较;无可执行建议的告警只是噪声;预算是护栏不是墙;成本也是质量信号;早预测、快反应。以上成本数据仅为通用参考。
Fill in the blanks, then copy

How to use this prompt

  1. 1Copy the full prompt below
  2. 2Replace the [____] placeholders with your specifics
  3. 3Paste into DeepSeek / Claude / ChatGPT to run

Related Coding prompts