Word Representation

前言

Word representation,理解之前1-hot represenation的缺點後,進一步提供Featurized representation: word embedding的概念來填補這個缺點,最後Visualizing word embedding,從圖形來理解word embedding的背後含義。

內容

  • Word representation

  • 1-hot represenation的缺點就是模型無法找出單字間的關係。
  • 從數學的角度上,透過1-hot represenation的單字,任兩個單字做內積都是0,完全沒有關係性存在。但單字之間,其實是存在很多相似詞或相反詞的關係性。
  • Featurized representation: word embedding

  • 將單字中的所有字典,根據feature進行分類(ex. gender, age, food..),如此每個單字就擁有自己的feature vector,也就是所謂的word embedding。
  • Visualizing word embedding

  • 從圖形上來理解,word embedding就是將word進行相聯性的分類。

該學到的

  • Word representation的缺點。
  • 什麼是word embedding。

results matching ""

    No results matching ""