參考筆記: 林軒田教授機器學習基石 第五講學習筆記
Recap and Preview
learning的兩個核心問題
- 能不能讓 和 非常接近?
- 能不能讓 非常小?
最後題目
Effective Number of Lines
Effective Number of Lines: 對這n個資料點來說的 分隔線種類
- 一定小於等於
- 可以用來取代 , 不懂為啥可以取代, 這樣不就只看 in-sample的表現了嗎 => 後面week6似乎會講
Effective Number of Hypothesis
dichotomy
一個 Dichotomy 就是一種分類組合,在二元分類裡這樣組合的上界就是 2 的 N 次方,我們可以用這個數字來取代無限大的 M。
為了移除掉對 的依賴, 我們要計算 (Growth Function) , 即對於這個Hypothesis Set 來說最大的 dichotomy set 的大小, 用來取代
(Growth Function)
以這個 Hypothesis set 能切出最多有多少種的 dichotomy
those inputs shattered by
這個 Hypothesis set 可以找出 到 的所有dichitomy, 即 種
Break Point
- 我們可以用 來取代
- 如果這個 Hypothesis Set 的 Growth Function 是 N 的多項式, 則在N很大的時候, 會變得很小。反之, 若 Growth Function 是 N 的指數成長, 就無法確保 跟 非常接近。
Break Point
給k筆inputs, 導致 比 小, 則k就是 break point, 同樣大於k的也都是break point
由上述我們可以推測 在 break point 為 k 時,