模型上线后的迭代是个棘手问题。直接替换线上正在运行的 v1 模型为 v2 版本,无异于一场赌博。新模型在离线评估中表现再好,也无法保证它在真实生产流量下的性能、延迟或业务指标不会出现衰退。我们需要一个受控的、可观测的、能快速回滚的发布流程。
2023-10-27