YOLO Algorithm
前言
YOLO是如何訓練,如何執行的。
內容
Training
- input: 100x100x3 圖片
- output: 3x3x16
- 3x3是因為將圖片切割成9宮格。
- 16是因為有2組不同anchor box,且每組anchor box有8個值。
- 無物體的grid cell的target Y該長怎樣?
- 有一個或兩個物體的grid cell的target Y該長怎樣?
- 現實訓練的output是19x19x40。
- 40 = 5 x 8
Making predictions
- 無物體時(藍色框)。
- 有一個物體時(綠色框)。
Outputting the non-max supressed outputs
- 每一個grid cell都會有兩個bounding box。
- 先丟棄機率pc低的grid cell,表示此cell可能都沒有物體。
- 在每個cell中的每個物體都要利用non-max supresseion分別跑過一次,來確保每個物體都擁有正確bounding box。
該學到的
- YOLO模型的input, output的shape是如何設計的。
- non-max suppression是如何利用在YOLO。