李宏毅ML課程[1]Learning Map
首先介紹一下本文要學習的東西~如下圖。

比如其中監督學習不包括線性模型,非線性模型等等
Regression
回歸模型的特性,是目標函數的輸出是一個標量。
比如:輸入是今天上午的PM2.5,以及昨天的PM2.5,要求輸出明天上午的PM值(一個標量)
如下圖表示:

那麼訓練數據表示格式如下:

Classification
其中包括二分類問題,如下:



每來一個郵件,進行判斷是否是垃圾郵件(二分類問題)
其中多分類問題的一個應用是判斷文檔的主題,如下:

Deep Learning
當然這些問題也可以用深度學習來解決。

其中,我們用CNN來作為學習分類器,判斷最終的所屬類別。
下面1簡單介紹一下幾種不同類別的學習。
Semi-supervised Learning

Transfer Learning

通過一部分狗貓的訓練數據,加上一些不相關的標註或者未標註的數據進行訓練,得到一個模型。
Unsupervised Learning

Structured Learning

(1)一段聲音,我們需要得到最可能的一句話。這個時候,我們無法窮舉所有的句子,然後挑選概率最大的句子。因為句子個數是無窮多的
(2)機器翻譯例子中,有一個源語言,要得到一個目標語言,也是無法之間使用多分類模型的,因為句子的個數是無窮的。
(3)第三個例子,人臉識別,判斷某個區域是否為人臉,也是無法之間用多分類模型進行預測,因為區域的個數也是無窮多個的。
Reinforcement Learning
其中監督學習與強化學習的區別是:

在當前某個狀態下,期望下一步動作,就是5-5
或者在當前某個狀態下,期待下一步動作,就是3-3
也就是說,監督學習訓練數據中,有著完整的輸入,輸出。
而強化學習是通過不停的比賽,強調如何基於環境而行動,以取得最大化的預期利益。中間過程有可能某個下子狀態是不利的,但是沒有關係
參考自李宏毅老師上課講義
推薦閱讀:
※線性方程組之二:行向量觀點
※【活動預告】近期更新的大數據、機器學習線上線下沙龍活動(12場)
※TensorFlow中RNN實現的正確打開方式
※[讀論文]fast-and-provably-good-seedings-for-k-means
TAG:机器学习 | 深度学习DeepLearning | 自然语言处理 |
