机器学习工程师面试被问到:“你训练了一个新的推荐模型,怎么确定它能替代旧模型?”你答:“我会对比验证集和测试集的指标。”面试结束。事实远比这复杂。本地测试(验证集/测试集)虽重要,却无法完全复制真实生产环境。直接上线新模型,风险极大。行业顶尖团队(Netflix、Amazon、Google)都 ...