Powered by GitBook

Single number evaluation metric

前言

利用單一的量化標準值來比較不同模型的成效。

內容

Using a single number evaluation metric

Precision:

在所有預測貓的圖片中，真的貓的圖片所佔的比例。

Recall:

在所有貓的圖片中，預測是貓的圖片的比例。

Precision和Recall之間彼此是存有你增我減的情況。

將Precision和Recall合而為一成單一量化標準F1，這樣更易於比較不同模型的成效。

Another example

再要將不同的衡量標準合而為一時，要先了解這樣的合併是否有根據，否則這樣的合併的衡量標準並無法有效地去衡量模型的好壞。

ex. 如果只是單純將各區域衡量結果取平均，當作這個algo的唯一的衡量，並不合理。每個區域可能還有其他的背景因素的考量才能做合併。

該學到的

為麼要用Single number evaluation metric。

results matching ""

No results matching ""