cnzylo
本站致力于IT相关技术的分享
使用 Tekton 构建支持模型自动验证与版本化部署的 Scikit-learn MLOps 流水线 使用 Tekton 构建支持模型自动验证与版本化部署的 Scikit-learn MLOps 流水线
团队的算法工程师扔给我一个 Git 仓库地址和一个 model.pkl 文件,说:“模型更新了,帮忙上线吧。”我问他这次更新的效果怎么样,他说:“效果嘎嘎好,在我笔记本上准确率提高了5个点。”我再问他,这次用的训练数据是哪一批?特征工程的逻
2023-10-27
基于自定义Babel插件与Loki实现CircleCI构建过程的深度性能剖析 基于自定义Babel插件与Loki实现CircleCI构建过程的深度性能剖析
我们团队的 monorepo 仓库,前端部分由超过四十个基于 Chakra UI 的 React 包构成。最近两个月,CircleCI 上的合并前检查(包括 lint、test 和 build)时间从可接受的15分钟悄然增长到了令人难以忍受
2023-10-27
构建基于 Tekton 的状态化模型晋级流水线 构建基于 Tekton 的状态化模型晋级流水线
一个常见的工程误区是将 MLOps 流水线等同于常规的 CI/CD。模型训练与部署的生命周期远比构建一个二进制包复杂,其核心区别在于对“状态”的依赖。一个无状态的流水线只能执行重复性任务,而一个生产级的 MLOps 系统必须能够回答:当前生
2023-10-27
结合DDD与事件溯源构建基于gRPC的幂等命令处理层 结合DDD与事件溯源构建基于gRPC的幂等命令处理层
在分布式系统中,一个看似简单的API调用背后,网络延迟、瞬时故障或客户端重试逻辑都可能导致同一请求被多次发送。对于一个普通的读请求,这通常无伤大雅。但对于一个修改系统状态的写操作,例如“为用户账户充值100元”,重复执行将直接导致数据不一致
2023-10-27
利用 gRPC-Go 与 Trino 构建混合模式 CV 特征管道并以 Cilium 实施网络隔离 利用 gRPC-Go 与 Trino 构建混合模式 CV 特征管道并以 Cilium 实施网络隔离
项目初期的需求很明确:搭建一个能同时支撑在线实时推理和离线模型训练的计算机视觉(CV)特征平台。在线路径要求毫秒级延迟,用于服务直接调用的特征提取;离线路径则要处理 PB 级的历史图像数据,为算法团队生成训练数据集。整个系统部署在 Kube
2023-10-27
基于 Go 与 NATS JetStream 构建协调海量 Playwright 实例的分布式压测架构 基于 Go 与 NATS JetStream 构建协调海量 Playwright 实例的分布式压测架构
问题起源于一次复盘。我们传统的后端性能压测,例如使用 JMeter 或 k6,虽然能精确模拟 API 负载,但完全忽略了一个关键环节:真实的用户体验。现代 Web 应用的性能瓶颈早已不单单是服务端响应时间,前端渲染、JavaScript 执
3 / 5