Powered by GitBook

Properties of word embeddings

前言

Analogies，模型是如何透過數學關係，來進行單字之間類比的推導。Analogies using word vectors，將這個數學關係更近一步寫成公式，最後再Cosine similarity，瞭解similarity function的內涵。

內容

Analogies

什麼是Analogies，就是類比。

(Man, Woman)是類比的關係，那如果給模型(King, ?)，是否模型可以推導出"Queen"呢?

透過vector差值的相似性來進行Analogies的推導。

Analogies using word vectors

圖形的表現上(Man, Woman)，(King, Queen)之間的距離差，應該是要接近的。

利用similarity function，需要傳入兩個input。

input 1: target vector (ek - em + ew)。

input 2: 在字典中loop每個單字ei。

最終透過similarity function，找到一個ei其相似值是最大的。

Cosine similarity

similarity的函數定義，利用Cosine來計算，當兩個vector所形成的角度越小，其值越大(相似度越大)。

當然也可以用距離方式來找相似度，但就是用距離要越小越好。

該學到的

模式是如何透過數學關係來進行Analogies的邏輯推導。

results matching ""

No results matching ""