Bounding Box Predictions

前言

之前的模型都是有規則的截圖(size跟stride),但有可能這些規則的方框都無法精準的框著物體。

內容

  • Output accurate bounding boxes

  • 當前的有規則的方框都無法精準的框著物體。
  • YOLO algorithm

  • 可以提供一個更精準的方框來框住物體。
    • 首先,將切割3x3=9個gird cell(實作上19x19)。
    • 將9個grid cell去判斷對應的label y。
    • 所以最終的output target = 3x3x8 (3x3=9 cells, 8=vector長度)。
  • 這樣的設計,讓模型不是在透過sliding window,而是利用grid cell,將整張圖完整的切割,然後找出每個cell中存在物品的可能性。
  • 19x19的好處,就是2個物品出現在同一個cell的機率小很多。
  • 透過Convolution implementation,我們可以一次預測9個cell,計算更加有效率,甚至可以做到即時計算。
  • Specify the bounding boxes

  • 從每個grid cell的左上角為原點(0,0),右下角(1,1)
  • bx,by必須介於0~1之間。
  • bw,bh可以大於1。

該學到的

  • 理解為何sliding window 無法滿足bounding box的預測。
  • 理解YOLO 算法是如何透過grid cell取代sliding window。

results matching ""

    No results matching ""