Negative Sampling

前言

Defining a new learning problem中提到如何簡化問題,再來Model中了解問題的簡化是如何降低計算量的運算,最後在Selecting negative samples提出一個公式去幫助我們選擇適當的negative samples。

內容

  • Defining a new learning problem

  • Negative Sampling是如何解決上一節Word2Vec所遇到的問題:計算量大的問題。
  • 首先,先轉化成二分法問題,Word2Vec是計算每個配對的context->target所出現的機率是多少,在Negative Sampling把這個機率簡化成0,1的問題。
  • 再來,只從字典中選擇K(5-20, 2-5)個sample做訓練,不用對整個字典都進行配對訓練,簡化計算量。
  • Model

  • 因為已經將問題轉成二分法的問題,所以計算公式也大幅簡化。
  • 只需要做K+1次的訓練(K個negative跟1個positive)。
  • Selecting negative samples

  • 跟上節一樣的問題,如何選擇適當negative單字,不然都選到無意義的單字(the, of, and..)做negative。
  • 提出了一個選擇的公式。

該學到的

  • 是如何簡化問題。
  • 了解計算量是如何降低。
  • 怎樣選擇一個negative單字。

results matching ""

    No results matching ""