Bounding Box Predictions
前言
之前的模型都是有規則的截圖(size跟stride),但有可能這些規則的方框都無法精準的框著物體。
內容
Output accurate bounding boxes
- 當前的有規則的方框都無法精準的框著物體。
YOLO algorithm
- 可以提供一個更精準的方框來框住物體。
- 首先,將切割3x3=9個gird cell(實作上19x19)。
- 將9個grid cell去判斷對應的label y。
- 所以最終的output target = 3x3x8 (3x3=9 cells, 8=vector長度)。
- 這樣的設計,讓模型不是在透過sliding window,而是利用grid cell,將整張圖完整的切割,然後找出每個cell中存在物品的可能性。
- 19x19的好處,就是2個物品出現在同一個cell的機率小很多。
- 透過Convolution implementation,我們可以一次預測9個cell,計算更加有效率,甚至可以做到即時計算。
Specify the bounding boxes
- 從每個grid cell的左上角為原點(0,0),右下角(1,1)
- bx,by必須介於0~1之間。
- bw,bh可以大於1。
該學到的
- 理解為何sliding window 無法滿足bounding box的預測。
- 理解YOLO 算法是如何透過grid cell取代sliding window。