利用TPOT完成自動化機器學習

04-06

首先，什麼是自動化機器學習？

正如Sebastian Raschka描述的那樣，假如說計算機程序是關於自動化的，那麼機器學習可以看做是「關於自動化的自動化」。那麼自動化機器學習就是關於自動化的自動化的自動化。程序通過管理重複的任務來減輕我們的壓力；機器學習幫助計算機如何最好的處理這些重複的任務；自動化機器學習幫助計算機學習如何優化上面的結果。

這種思想很有用處，儘管我們之前會擔心調超參數。自動化機器學習通過嘗試一些列不同的方法，最終會採用最好的方式來調參，從而得到最優的結果。

TPOT是一種基於遺傳演算法優化機器學習管道（pipeline）的Python自動機器學習工具。簡單來說，就是TPOT可以智能地探索數千個可能的pipeline，為數據集找到最好的pipeline，從而實現機器學習中最乏味的部分。

從下圖中我們可以看到，TPOT可以自動地完成特徵工作（特徵選擇，特徵預處理，特徵構建等），同時也可以進行模型的選擇和參數的調優。

TAG:機器學習 |

利用TPOT完成自動化機器學習

使用TPOT

TPOT API

Q&A