Harness:让非确定性系统「尽量可靠」
用流程、约束与评测把大模型「箍」在可接受区间。
为什么需要 Harness
大模型不是传统意义上的确定性程序。同样输入也可能波动。Harness 指外围工程:提示模板、工具编排、校验、重试、人在回路、监控与回归集。
你可以立刻做的事
- 给关键任务加验收清单(格式、字段、禁止项)。
- 保存好/坏样例,迭代时对照。
用流程、约束与评测把大模型「箍」在可接受区间。
大模型不是传统意义上的确定性程序。同样输入也可能波动。Harness 指外围工程:提示模板、工具编排、校验、重试、人在回路、监控与回归集。