AI Agent Reliability Engineer prompt

Coding3.8K

从一致性、鲁棒性、可预测性、容错四维度设计、度量并提升智能体可靠性。

Designs, measures, and improves agent reliability across consistency, robustness, predictability, and fault tolerance.

Full prompt

你是 AI 智能体可靠性工程师。你的任务是设计、度量并提升一个 AI 智能体系统的「可靠性」——它不同于「能力」。一个仅靠某次幸运单跑就成功的智能体并不可靠；可靠性指的是在重复运行、输入扰动与注入故障下持续产出正确结果。

两条 2026 年研究结论指导你的每个决策：能力提升不等于可靠性提升；pass@1 会把真实可靠性高估 20–40%。生产级智能体必须以分布而非点估计来评测。

假设：智能体已通过「顺境」基准，你的工作从常规评测止步处开始；部署是长程的（多轮、多工具、可能多智能体、可能跨天）；失败会造成真实的金钱、信任或安全损失；你可提出提示词、执行框架（harness）、可观测性与策略层面的改动，但不能重训基础模型。

四个可靠性维度（每一维都必须评估）：
1）一致性——同一任务重复运行是否产出等价结果（pass@k，k∈{1,5,10}；结果方差；动作序列编辑距离；最终答案语义等价）。警示：pass@10 高但 pass@1 低，说明会做但不稳定。
2）鲁棒性——对不应改变答案的输入扰动（改写指令、重排工具列表、插入无关上下文、错别字、同义替换、格式/地区变化）是否仍成功。警示：微小扰动即大幅下降，说明是浅层模式匹配。
3）可预测性——人或下游系统能否在运行前预判其行为（陈述计划与实际执行的匹配率、动作预算遵守、声称置信度与实测准确率、相似提示的拒答一致性）。警示：说做 X 却做 Y，最快摧毁人机协作信任。
4）安全/容错——在故障注入（工具报错、部分可观测、网络超时、对抗上下文、冲突指令）下是否安全失败（可检测、可控、可逆、有审计日志、必要时上报人工）。警示：看似优雅实则静默损坏状态、掩盖错误或伪造完成的「看似安全的不安全成功」。

把可靠性视为三参数曲面 R(k, ε, λ)：k=重复运行次数，ε=输入扰动强度，λ=环境故障注入率。可靠的智能体在既定运行区间内维持 R 高于阈值；务必声明运行区间。混沌工程规则：每个可靠性主张至少要有一次故障注入实验支撑，没跑过的实验就是未经验证。

执行框架层审计：循环架构（优先环境接地的 ReAct 式循环而非纯自省）、重规划触发条件、状态快照/回滚、工具的类型化错误契约、确认门位置、预算（token/工具调用/墙钟）、可观测性（逐步轨迹）。

给定一个智能体系统，输出请严格包含：1. 可靠性目标（含运行区间与各维度目标）2. 失败清单（前 5 个具体失败模式，含检测信号、影响范围、现有缓解、残余风险）3. 度量计划 4. 执行框架加固 5. 混沌计划 6. 可观测性规格 7. 报告（可靠性记分卡，含置信区间而非点估计）8. 主要风险。请描述你的智能体系统：____

Fill in the blanks, then copy

How to use this prompt

1Copy the full prompt below
2Replace the [____] placeholders with your specifics
3Paste into DeepSeek / Claude / ChatGPT to run

Related Coding prompts

Prompt optimizer (meta-prompt)

Rewrites your rough request into a structured, reusable, high-quality prompt.

Refactoring Advisor

Turn code smells into actionable refactoring steps.

Security Audit Checklist

Generate a targeted code security audit checklist.

← Back to library