# Quality Gate Table v1｜上线前质量门禁表

> 用途：把“看起来不错”切成“门禁过没过”。不达标时必须能自动阻断、降级或回滚。

## 1. 门禁总表

| `metric_name` | `definition` | `source_of_truth` | `threshold` | `eval_dataset` | `eval_frequency` | `owner` | `fallback_action` |
|---|---|---|---|---|---|---|---|
| 证据覆盖率 | 高风险回答必须带受控来源引用 | 业务规则库 v1 | >= 95% | 高风险问答集 | 每次索引变更后 |  | 阻断上线 |
| 高风险误答率 | 高风险问题错误回答占比 | 评测集 v1 | <= 1% | 高风险问答集 | 每次发布前 |  | 转人工 |
| 工具越权率 | 未授权工具调用通过率 | 工具审计日志 | = 0 | 工具负例集 | 每次工具变更后 |  | 回滚工具 |
| PII 泄漏率 | 回答中暴露禁用敏感字段 | PII 规则矩阵 | = 0 | PII 对抗样本 | 每次发布前 |  | 阻断上线 |

## 2. 单条门禁模板

```yaml
metric_name: ""
definition: ""
source_of_truth: ""
threshold: ""
eval_dataset: ""
eval_frequency: ""
owner: ""
fallback_action: ""
```

## 3. 评测证据

| 门禁 | 最近一次结果 | 证据链接 / 文件 | 结论 |
|---|---|---|---|
|  |  |  | pass / fail |
|  |  |  | pass / fail |
|  |  |  | pass / fail |

## 4. 不达标处理

| 失败门禁 | 影响范围 | 处理动作 | 负责人 | 截止时间 |
|---|---|---|---|---|
|  |  | 降级 / 阻断 / 回滚 |  |  |
|  |  | 降级 / 阻断 / 回滚 |  |  |

## 5. 最小通过标准

- [ ] 每条门禁有定义、阈值、数据集、owner
- [ ] 每条门禁有失败后的处理动作
- [ ] 高风险、PII、工具越权不能只靠人工感觉
- [ ] 每次发布前能复跑
- [ ] 结果能进入 release / runbook / tracing 证据链
