生产环境一次部署失败的根源,最终定位到一个不起眼的配置变更。预发环境的NoSQL只读从库地址变更后未同步到最新的部署脚本,而单元测试又无法覆盖这种基础设施层面的不一致性。这导致新上线的应用实例持续向一个已经失效的从库节点发起读请求,引发大量
2023-10-27