Definition of VC Dimension

定義

假設最小的 break point 為k, 則最大的 non - break point 為 k-1, 即 VC Dimension

  • 能夠 shatter 的最多 input

意義

假設 的 VC Dimension 為 N

  • 可以 shatter 最多 N 個資料點
  • 但不是任意 N 個資料點都能被 給 shatter
  • 當 N 夠大, 也夠大時, 成長函數會比 N 的 VC dimension 次方來得小
  • VC dimension 是 finite 的 Hypothesis set 才是好的

VC Dimension of Perceptrons

證明 PLA 在資料維度為 d 時, VC Dimension 是 d+1

  • 證明 , 只要找到一種d+1筆的資料是可以被 PLA 給 shatter 的即可
  • 證明 , 需要證明對於任何 d+2 筆的資料, PLA 都不能夠 shatter

    本段證明看不懂

總之 PLA 的 VC Dimension 就是 d+1 ㄏㄏ

Physical Intuition of VC Dimension

  • 和 M 一樣, VC Dimension 不論太大或太小都不好, 因此要選擇一個好的 VC Dimension

Interpreting VC Dimension

假設壞事情( 差很多) 發生的機率為 , 則此時 generalization error , 等同於我們有 信心水準使得 會落在

  • 我們現在知道
  • 這裡的 也就是我們付出的penalty, 而這個penalty會隨著 model的強大(VC Dimension的提高)而變得更大

  • VC Dimension 可以說是 model 的 complexity

results matching ""

    No results matching ""