训练集和测试集如果来自不同的分布,会怎样?
类似的问题不是没遇到过只是语境不同,比如说模型上次构建以来是否发生了数据漂移?销售分析中产品 A 和产品 B 的分布是否存在差异?归结下来问的都是同一件事,如何量化两个分布之间的差异。
https://avoid.overfit.cn/post/7e479c1020bb4a25ab533c7cc4761894
训练集和测试集如果来自不同的分布,会怎样?
类似的问题不是没遇到过只是语境不同,比如说模型上次构建以来是否发生了数据漂移?销售分析中产品 A 和产品 B 的分布是否存在差异?归结下来问的都是同一件事,如何量化两个分布之间的差异。
https://avoid.overfit.cn/post/7e479c1020bb4a25ab533c7cc4761894