给关键任务做一页「验收清单」
用可观察条件逼近可靠输出(Harness 入门)。
任务
选一个 出错成本高 的场景(对外邮件、费用说明、医疗/法律相关表述等——可虚构公司名),写 8~12 条 验收清单,用于人工或模型自检。
要求
- 每条用 可观察 描述(能回答「是/否」),避免「写得专业一点」这类空话。
- 至少 2 条 针对 幻觉风险(未证实数据、编造链接等)。
- 至少 1 条 针对 格式(JSON/Markdown/主题行等)。
用法提示
清单可贴在提示词末尾:「逐条自检后再输出终稿。」
用可观察条件逼近可靠输出(Harness 入门)。
选一个 出错成本高 的场景(对外邮件、费用说明、医疗/法律相关表述等——可虚构公司名),写 8~12 条 验收清单,用于人工或模型自检。
清单可贴在提示词末尾:「逐条自检后再输出终稿。」