Learning is Impossible?
Probability to the Rescue
- N: sample數量
- : sample 裡面的 positive item 機率
- : 實際上的 positive item 機率
- : 自訂的 與 差距門檻
- PAC: 有很高的機率差不多是對的
Connection to Learning
- i.i.d.: independently and identically distributed
最後的問題沒懂
Connection to Real Learning
不好的資料
- 跟 差很多
假設
- 資料集有 到 這麼多種
- Hypothesis set 有 到 這麼多種
那麼
- 只要 這個資料集 使得Hypothesis set中的其中一個 的 跟 差很多, 我們就說這個資料集 是不好的資料集
- 假設Hypothesis set 有M個不同的 hypothesis, 則資料集是bad的機率為
- 也就是說在Hypothesis set有限, 且資料集的資料量大的時候, 資料是壞的機率仍然是小的
總結
作業一
i dunno if my answer is correct
678全錯
9.
12.
13. 錯
14. ABCD四種骰子都有1/2的機率是orange 錯
15~20懶得寫code ˊˋ