Definition of VC Dimension
定義
假設最小的 break point 為k, 則最大的 non - break point 為 k-1, 即 VC Dimension
- H 能夠 shatter 的最多 input
- dVC=min(k)−1
意義
假設 H 的 VC Dimension 為 N
- H 可以 shatter 最多 N 個資料點
- 但不是任意 N 個資料點都能被 H 給 shatter
- 當 N 夠大, dVC 也夠大時, 成長函數會比 N 的 VC dimension 次方來得小
- VC dimension 是 finite 的 Hypothesis set 才是好的 H
VC Dimension of Perceptrons
證明 PLA 在資料維度為 d 時, VC Dimension 是 d+1
- 證明 dVC≤d+1, 只要找到一種d+1筆的資料是可以被 PLA 給 shatter 的即可
證明 dVC≥d+1, 需要證明對於任何 d+2 筆的資料, PLA 都不能夠 shatter
本段證明看不懂
總之 PLA 的 VC Dimension 就是 d+1 ㄏㄏ
Physical Intuition of VC Dimension
- 和 M 一樣, VC Dimension 不論太大或太小都不好, 因此要選擇一個好的 VC Dimension
Interpreting VC Dimension
假設壞事情(Ein 和 Eout 差很多) 發生的機率為 δ=4(2N)dVCexp(−18ϵ2N), 則此時 generalization error |Ein(g)−Eout(g)|≤ϵ=√8Nln(4(2N)dVCδ), 等同於我們有 1−δ 的信心水準使得 Eout 會落在 [Ein−ϵ,Ein+ϵ] 內
- 我們現在知道 Eout≤Ein+√8Nln(4(2N)dVCδ)
- 這裡的 √8Nln(4(2N)dVCδ) 也就是我們付出的penalty, 而這個penalty會隨著 model的強大(VC Dimension的提高)而變得更大
- VC Dimension 可以說是 model 的 complexity