Powered by GitBook

Bounding Box Predictions

前言

之前的模型都是有規則的截圖(size跟stride)，但有可能這些規則的方框都無法精準的框著物體。

內容

Output accurate bounding boxes

當前的有規則的方框都無法精準的框著物體。

YOLO algorithm

可以提供一個更精準的方框來框住物體。

首先，將切割3x3=9個gird cell(實作上19x19)。

將9個grid cell去判斷對應的label y。

所以最終的output target = 3x3x8 (3x3=9 cells, 8=vector長度)。

這樣的設計，讓模型不是在透過sliding window，而是利用grid cell，將整張圖完整的切割，然後找出每個cell中存在物品的可能性。

19x19的好處，就是2個物品出現在同一個cell的機率小很多。

透過Convolution implementation，我們可以一次預測9個cell，計算更加有效率，甚至可以做到即時計算。

Specify the bounding boxes

從每個grid cell的左上角為原點(0,0)，右下角(1,1)

bx,by必須介於0~1之間。

bw,bh可以大於1。

該學到的

理解為何sliding window 無法滿足bounding box的預測。
理解YOLO 算法是如何透過grid cell取代sliding window。

results matching ""

No results matching ""