Powered by GitBook

Error analysis in beam search

前言

如何對beam search進行錯誤分析。

內容

Example

人類翻譯句子(比較準確的句子)，機器翻譯的句子(比較不準確的句子)。

理想上，機器翻譯的句子要等於(=)人類翻譯句子。

為什麼機器翻譯的句子會比較糟，有可能在兩個地方出現問題。

RNN: 將法語生成embedding vector。

Beam Search: 根據embedding vector找出最佳的翻譯句子。

Error analysis就是幫助我們判斷哪一個比較有可能有問題。

Error analysis on beam search

首先，先分別計算p(y*|x)跟P(y^|x)的機率。

case1: p(y*|x) > P(y^|x)

Bean search有問題。

因為y明明比y^更準確，然而bean search卻選擇y^而不是y。

case2 p(y*|x) <= P(y^|x)

RNN有問題。

Bean search的確正確選出較高y^的單字，但這些單字卻都不是準確度較高的人類所選擇的單字。

Error analysis process

對比p(y*|x)跟P(y^|x)差異較大的句子。

列出表格統計是beam search的問題多還是RNN的問題多。

優先處理檢查問題多的那一塊。

該學到的

如何對beam search進行錯誤分析。

results matching ""

No results matching ""