Training and testing on different distributions
前言
如何處理training and testing分布不同的問題。
內容
Cat app example
- training set中的照片是屬於清晰的照片,但在test set是模糊的照片。
- 方法1: 將training set和test set的所有照片,重新混合,分配。
- 這樣是有問題的,導致了dev/test set分佈出現不同,讓我們的目的改變(原本的目的就是要可以處理那些模糊的照片)。
- 方法2: 保持dev/test set的分佈不變,將training set中融合一些dev set的資料,雖然會改變些training set的分佈,但還可以接受。
Speech recognition example
- training 和 dev/test set的分佈有很大的差異。
- 將dev/test set中50%的資料,融合到training set中。
該學到的
- 如何處理training and testing分布不同的問題。